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1976 年，当政府管理与政治学教授 Eric Uslaner 向 SAGE 出版社的创始人 
Sara 建议出版关于重要定量研究方法的简明小册子时，没有人预见到这套书会 
取得巨大成功。 

那年夏天，社会科学定量研究方法”丛书诞生。统 一 的、朴素的绿色封面, 
上面仅仅印着书名、作者名及本书所属的系列名。 Iverson 和 Northporth 的《变 
量分析 》 （Analysis of Variance I Nagel 的《运筹学》 （ Operations Research ) 
以及 Henkel 的《显著性检验 》 （yeste ofS/gn/Z/cance ) 是最早出版的几本，每 
本售价 2.95 英镑，被形容为"像烤饼一样好卖”。 

SAGE 选择了 20 种顶尖的定量研究工具，然后去寻找合适的作者，邀请 

他们围绕这些工具撰写 92 页的小书。这些薄薄的绿皮书在课堂上深受欢迎， 
在图书馆成套陈列。 

至今，绿皮书系列中共有 160 种在初版或再版。书的主题反映了量化研究 
方法的 发展： 从基础统计知识、数据类型、测量到计算机的应用以及博 弈论。 
这套书非常畅销，其中最畅销的一本，是 1980 年出版的 Michael Lewis-Beck 
的《回归方法的应用 》 （Applied Regression ) Q 



出版说明 


本书由三种讨论交互表分析的小册子组成，分别是《对数线性模型》、《流动 
表分析》和《关联模型》。列表数据在分析和理解社会流动和社会分层方面具有 
重要的作用。本书首先介绍了用于检验变量间关系的对数线性模型及其检验 
和应用，然后考察了各类流动表数据分析模型的异同，最后特别介绍了双向表、 
三向表中的关联模型、偏关联模型和条件关联模型及其实际应用。 

《对数线性模型》使用大量例子阐明了对数线性模型的具体运用，特别是用 
于分析多维交互表的分层对数线性模型。《流动表分析》应用一个有关父子职 
业问题的流动表数据来具体介绍流动表分析的概念、方法、特征等。《关联模 
型》分别介绍了行效应模型、列效应模型、行列效应模型、行列乘法效应模型等 
不同形式，并阐释了关联模型在交互表上的应用。 


往事如烟，光阴如梭。转眼间，岀国已然十年有余。1996年赴美留学，最初 
选择的主攻方向是比较历史社会学，研究的兴趣是中国的制度变迁问题。以我 
以前在国内所受的学术训练，基本是看不上定量研究的。一方面，我们倾向于 
研究大问题，不喜欢纠缠于细枝末节。国内一位老师的话给我的印象很深，大 
致 是说: 如果你看到一堵墙就要倒了，还用得着纠缠于那堵墙的倾斜角度究竟 
是几度吗？所以，很多研究都是大而化之，只要说得通即可。另一方面，国内 
(十年前)的统计教学，总的来说与社会研究中的实际问题是相脱节的。结果 

是，很多原先对定量研究感兴趣的学生在学完统计之后，依旧无从下手，逐渐失 
去了对定量研究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量研究方面有着系统 
的博士训练课程。不论研究兴趣是定量还是定性的，所有的研究生第一年的头 
两个学期必须修两门中级统计课，最后一个学期的系列课程则是简单介绍线性 
回归以外的其他统计方法，是选修课。希望进一步学习定量研究方法的可以在 
第二年修读另外一个三学期的系列课程，其中头两门课叫“调査数据分析，，，第 
三门叫“研究设计”。除此以外，还有如“定类数据分析”、“人口学方法与技 术”、 
“事件史分析”、“多层线性模型”等专门课程供学生选修。该学校的统计系 、心 
理系、教育系、经济系也有一批蜚声国际的学者，提供不同的、更加专业化的课 
程供学生选修。2001年完成博士学业之后，我又受安德鲁 • 梅隆基金会资助， 
在世界定量社会科学研究的重镇密歇根大学从事两年的博士后研究，其间旁听 
谢宇教授为博士生讲授的统计课程，并参与该校社会研究院 (Institute for Social 
Research ) 定量社会研究方法项目的一些讨论会，受益良多。 
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荈表数攥分析 


2003年，我赴港工作，在香港科技大学社会科学部，教授研究生的两门核心 
定量方法课程。香港科技大学社会科学部自创建以来，非常重视社会科学研究 
方法论的训练。我开设的第一门课“社会科学里的统计学” (Statistics for Social 
Science) 为所有研究型硕士生和博士生的必修课，而第二门课“社会科学中的定 
量分析”为博士生的必修课(事实上，大部分硕士生在修完第一门课后都会继续 
选修第二门课)。我在讲授这两门课的时候，根据社会科学研究生的数理基础 
比较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的例子，结合语言和 
图形，帮助学生理解统计的基本概念和模型。课程的重点放在如何应用定量分 
析模型研究社会实际问题上，即社会研究者主要为定量统计方法的“消费者，，而 
非“生产者”。作为“消费者”，学完这些课程后，我们一方面能够读懂、欣赏和评 
价别人在同行评议的刊物上发表的定量研究的 文章; 另一方面，也能在自己的 
研究中运用这些成熟的方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有少量重复，但各有侧 
重。“社会科学里的统计学” (Statistics for Social Science) 从介绍最基本的社会 
研究方法论和统计学原理开始，到多元线性回归模型结束，内容涵盖了描述 
性统计的基本方法、统计推论的原理、假设检验、列联表分析、方差和协方差 
分析、简单线性回归模型、多元线性回归模型，以及线性回归模型的假设和模 
型诊断。“社会科学中的定量分析”则介绍在经典线性回归模型的假设不成 
立的情况下的一些模型和方法，将重点放在因变量为定类数据的分析模型 
上，包括两分类的 logistic 回归模型、多分类 logistic 回归模型、定序 logistic 回 
归模型、条件 logistic 回归模型、多维列联表的对数线性和对数乘积模型、有关 
删节数据的模型、纵贯数据的分析模型，包括追踪研究和事件史的分析方法。 
这些模型在社会科学研究中有着更加广泛的应用。 

修读过这些课程的香港科技大学的研究生 ，一 直鼓励和支持我将两门课的 
讲稿结集出版，并帮助我将原来的英文课程讲稿译成了中文。但是，由于种种 
原因，这两本书拖了四年多还没有完成。世界著名的出版社 SAGE 的“定量社 
会科学研究”丛书闻名遐迩，每本书都写得通俗易懂。中山大学马骏教授向格 
致出版社何元龙社长推荐了这套书，当格致岀版社向我提岀从这套丛书中精选 



总序 


一批翻译，以飨中文读者时，我非常支持这个想法，因为这从某种程度上弥补了 
我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种语言的精准把握能 
力，还要有对实质内容有较深的理解能力，而这套丛书涵盖的又恰恰是社会科 
学中技术性非常强的内容，只有语言能力是远远不能胜任的。在短短的一年时 
间里，我们组织了来自中国内地及港台地区的二十几位研究生参与了这项工 
程，他们目前大部分是香港科技大学的硕士和博士研究生，受过严格的社会科 
学统计方法的训练，也有来自美国等地对定量研究感兴趣的博士研究生。他 
们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智明、叶华、张卓妮、 
郑冰岛，硕士研究生贺光烨、李兰、林毓玲、肖东亮、辛济云、於嘉、余珊珊，应 
用社会经济研究中心研究员李 俊秀； 香港大学教育学院博士研究生洪岩璧； 
北京大学社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系讲师巫 
锡炜； 中国台湾“中央”研究院社会学所助理研究员林 宗弘； 南京师范大学心 
理学系副教授陈陈;美国北卡罗来纳大学教堂山分校社会学系博士候选人姜 
念涛; 美国加州大学洛杉矶分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单的介绍。尽管每本 
书因本身内容和译者的行文风格有所差异，校对也未免挂一漏万，术语的标 
准译法方面还有很大的改进空间，但所有的参与者都做了最大的努力，在繁 
忙的学习和研究之余，在不到一年的时间内，完成了三十五本书、超过百万字 
的翻译任务。李骏、叶华、张卓妮、贺光烨、宋犧、於嘉、郑冰岛和林宗弘除了 
承担自己的翻译任务之外，还在初稿校对方面付岀了大量的劳动。香港科技 
大学霍英东南沙研究院的工作人员曾东林，协助我通读了全稿，在此我也致 
以诚挚的谢意。有些作者，如香港科技大学黄善国教授、美国 约翰. 霍普金 
斯大学郝令昕教授，也参与了审校工作。 

由于所选每本书都有一篇序言，对相关方法的背景和应用作了很好的介 
绍，我们均予以保留，内容在此不再赘述。为了方便起见，我们将内容相似的书 
目集册出版，每册 三至五 本不等，共八册，它们分 别是: 《线 性回归分析基础》、 
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M 裹敝餳分析 


《高级回归分析》、《广义线性模型》、《列表数据分析》、《纵贯数据分析》、《因果关 
系模型》、《社会科学中的数理基础及应用》和《数据分析方法五种》。所冠书名 
未必能精准涵盖其中的内容，读者可自行参阅每本书的序言或目录。 

我们希望本丛书的出版，能为推动国内社会科学定量研究的扎实学风作出 

一点贡献。 

吴晓刚 

于香港九龙清水湾 
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通球撰写这本《对数线性模型》，戴维•诺克和彼得•丄伯克帮了我们一个大忙 。赛 
社会科学研究的大多数领域，最近几年，涌现出大量依靠各种技术对类别或名义变最进 
行多元分析的文章。但是，绝大多数从事实践工作的社会科学家都对这些技术感到困 
惑，函为这些术语通常并不为人所熟悉，而且看似与相关和回归分析中那些众所周知的 
概念无甚关联。如果你正被那些含有诸如优比、边际发生比或条件发生比、一般对数线 
性模型、饱和或非饱和模型、效应参数等类似术语的文章所困扰，阅读此书将对你大有裨 
益。诺克和伯克从头开始，为我们介绍、界定、讨论，并用大量的例子来澄清这些术语的 
含义。在这一过程中，他们将这些神秘的概念变得易于理解，即使对于大多数门外汉而 
言也是如此。 

诺克和伯克讨论了 一般对数线性模型,这一模型并不区分自变量和因变量，而是通 
过分析单元格的期望频数来检验类别变董间的关系;他们也讨论了 logit 模型，这一模型 
通过分析作为自变量函数的因变董的期望发生比来检验自变置与因变董之间的关系。 
他们从处理二分变量的方法开始讨论，然后逐步形成一个处理多类别变量的方法。 

本书使用了大置的例子,大部分来源于政治社会学。本书中被扩展的例子包括讨论 
在控制了种族和教育后，自愿性社团组织成员身份与选举投票率之间的关系 分析; 对美 
国大众的公民自由态度的人口决定因素的因果分析;对党派认同与1972年和1976年总 
统选举之间关系的截面分析的比较 研究; 对从1956年到1960年之间的固定祥本追踪研 
究中党派认同与宗教关系的 检验; 对宗教与堕胎态度之间关系的分析;对代际职业流动 
的考察以及一些其他例子。每个例子都阐明了对数线性模型的具体运甩，比如，用作因 
果模型的模拟，进行时间序列分析,同步检验多个类别自变董对一个类别因变置的影响 
等等。由于诺克和伯克毫不吝啬地使用了许多不同数据库的例子,读者们不仅可以对有 
关对数线性模型的设计和检验的基本概念有所了解，同时也可以培养一种对这些模型的 
广泛适用范围的良好判断力。很显然，対数线性模型有着更为宽广的应用范围，虽然近 
些年对数线性模型或许已经在最大程度上在社会学中“流行”起来,但毫无疑问在接下来 
的10年里，它将在政治学、经济学、人类学、大众传播和其他领域中成为一个更加重要的 




工具 6 它甚至可能使心理学和教育测试中的方差分析技术得到长足发展。 

诺克和伯克很明显是对数线性镆型的热情拥趸，虽然他们希望不仅可以_释这个模 
型，而且可以将它发扬光大，但是他们也承认这一模型的一些不足，并在本书中涵盖了一 

些与这些建模技术的应用有关的具体问题以及不太明确的实质性问趣。他们在合适的 

... ... . _ : .. . . . ■•■■■■ •- •■- ■ • • ;• ....... ... ■ - . - - ■ ...... - - . ' . ' :- •' ■:- . ... .. ... 

阶段对自己的陈述做了一个很好的总结。在总结中，他们讨论了对数线性模型运用中的 
具体问题,这些问题是所有希望有效使用这些模型的人所必须面 对的。 

尽管一些材料比较难懂，需要认真细致地学习，尤其是对那些统计初学者而言更是 
如此,但我完全相信，诺克和伯克在本书中的清晰_述将使此书能够被广泛接受。对数 
线性模 S 是一个 很难阐 述清楚的题目，而本书则是最好的对数线性模型教学材料之 一 o 

' •■- .•； - . •:' ；:：v V ' .. . ' .... . . •:: . ，.:■- '■ - . . - ■ ■ : 
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第 1 章 I 交互表中的关系 





我们将通过对自愿性社团成员身份与投票参与率之间关系的一个详细分 
析来展现对数线性模型的基本原理。这个真实问题来源于研究民主参与的政 
治社会学。多年以来，研究者已经认识到，自愿性社团组织的成员更有可能参 
与各种各样的政治活动，诸如就社区问题与公共官员沟通，为候选人开展竞选 
活动和参与选举投票 (Verba & Nie , 1972； Olsen , 1972)。但是，一些问题依然 

存 在：自 愿性社团成员身份与参与投票这个相关关系是不是社会地位的虚假结 
果？因为社会地位与这两个变量都正相关。当控制了社团参与程度与社会地 
位之后，白人和黑人在政治行为上是否仍然存在差异 （Thomson & Knoke, 
1980)? 

为了检验这些假设，我们选用了 1977年综合社会调查的数据，这个非机构 
性调查有1530个成年人 (18 岁及以上）的全国样本，是在国家科学基金的资助 
下，由詹姆士 • A . 戴维斯 (James A . Davis ) 领导的芝加哥全国民意研究中心每 
年进行一次(现在为每两年一次）。“选举参与”( V )指的是调查对象是否参加了 
1976年的选举(不具备选举资格者被排除）。“自愿性社团组织的成员身份” 
( M ) 就是调查对象属于所列出的16种社团组织的数量，但排除了教会成员身份 
(Knoke & Thomson , 1977,该书讨论了教会成员身份如何与其他种类的成员 
身份不同）。我们将那些不属于任何组织的人与那些具有一个或更多组织成员 
身份的人做对比。种族 (R) 也是一个二分变量，分为白人和非白人(大多数为黑 
人)。最后，将教育 ( E ) 重新编码为3个大的 类别: 高中毕业以下、高中毕业、有 
大学经历并包含大学毕业及以上。最终，我们将分析这个四维交互表中的关 
系，但在刚开始时，我们集中分析成员身份一投票参与间的关系，将后一个变量 
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界定为依赖于或取决于前一个变量。后面的例子将会处理多类别变量以及讨 
论将变量合并为更少类别时的风险。 

确定两个类别变量间关系或相关的传统方法是计算自变量中各类别的百 
分比，并比较这些百分比。如果变量各类别间的百分比差异显著(使用一般的 
卡方独立性检验），那就表明存在相关关系。相关关系的形式——单调、线性或 

非线性的-取决于交互表单元格中百分比的分布模式 ( Reynolds ， 1977)。在 

表 1. 1中，没有组织成员身份的人中有54%参加了投票，而在有一个或更多成 
员身份的人中则有75%参加。在自愿性社团组织中，有成员身份的人比没有成 
员身份的人在投票参与率上高了 21个百分点。这张表的卡方检验值为 67. 7, 


表明在这两个变量之间存在着统计上显著的 （p < 0. 001) 相关关系。 

表 1.1 选举参与和组织成员身份交互表 


• 



成员身份 ( M ) 




一个或更多 

没有 

合计 

' 投票参与 
( V ) 

投票 

没有投票 

fn = 689 
f 2 i = 232 

fi 2 = 298 

{22 = 254 

fi . = 987 
^ 2 . = 486 

合计 

f 1 = 921 

f 2 = 552 

f . = 1473 


为了运用对数线性模型，我们首先必须重新概念化因变量。发生比将代替 
比例 —— 单元格频数除以类别总数——成为有待解释的方差的基本形式。在 
日常生活中，我们最熟悉的关于发生比的例子来自赛马和其他形式的赌博。发 
生比就是属于某一类别的频数与不属于这一类别频数的比率。它可以被解释 
为一个随机选取的个体被观察到属于一个我们关注的类别而不是另一个类别 
的机会。例如，在表 1. 1中，一个人在1976年总统选举中投票的发生比是987/ 
486 = 2. 03,或者大约为2 : 1 (注意，这里可能出现了一些自我报告时的夸大， 
因为潜在投票者的实际投票率大概为55%，只有 1. 22的发生比）。 

刚才计算出的发生比是一个边际发生比，只应用了表中一边的总频数而没 
有考虑任何其他变量的影响。我们也可以计算表中的条件发生比，它对应于条 
件频数。条件发生比就是在所给出的一个组织成员身份的特定层次上，参加投 
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票相对于不参加投票的机会。就表 1. 1而言，在非组织成员中，投票的发生比是 
1. 17,而在组织成员中，投票的发生比为 2. 97。因此，社团成员投票的发生比要 
比无社团成员身份的人的投票发生比大 2. 5倍多。 

要注意的是，如果“没有投票”单元格中的频数为0,那么发生比就不能被界 
定。因为整数被0除是没有意义的。出于这个原因，许多分析者过去在进行对 
数线性分析之前，都会习惯性地在每个单元格上加 0. 5。这种做法的适当性有 
待商榷。在本书中，我们的数据不需要做任何这样的调整。 

在一张传统的百分比表中，如果自变量在所有层次上的百分比都相等或非 
常接近，那么这两个变量就是不相关的。同样，在一张发生比表中，如果所有的 
条件发生比都彼此相等或接近，并且也都等于边际发生比，变量之间就是不相 
关的。实质上，也就是说，不管一个人的社会参与情况如何，他/她参与投票的 
机会都将是均等的。 

为了直接比较两个条件发生比，我们可以用第一个条件发生比除以第二个 
条件发生比，生成一个单一的统计值，这就是优比。优比是对数线性模型的主 
要工具，我们有必要花费一些时间来探讨它的特性和解释。为了明白优比到底 
是什么，我们从构成条件发生比的最初频数 开始： 

观测优比 ( VM ) = ( Wf 21 )/( f 12 / f 22 ) 

通过简化，对于一个 2 X 2 交互表，上面的公式就变成熟悉的交叉相 乘比： 

发生比 ( VM ) = ( fn )( f 22 )/( f 21 )( f 12 ) 

要注意的是，对2 X 2交互表相关关系的传统测量方法，尤尔 Q 系数是优比的一 
个简单函数： 

f 欠 O 苳数 = ddsratio — 1 = (fn )( f 22 ) — ( f 12 )( f 2 i ) 

、’、 oddsratio + 1 (fu ) ( f 2 2 ) + ( fi2 ) “ 2i ) 

虽然尤尔 Q 系数的值域范围是从一 1. 00 到 1. 00,其中，0表示没有相关关系，但 
优比只可取正值，没有上限，当不存在相关关系时为 1. 00( 比如，两个条件发生 
比相 等）。 优比大于 1. 00表明变量间的正相关，而优比小于 1. 00表明变量间的 
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逆相关。当然，当变量只是在名义层次上被测量时，共变的“方向”是任意的，因 
为变量类别的次序能够被改变。在我们的例子中，投票和属于组织被认为比不 
投票或不属于任何组织具有“更高”的数值。因此，观测优比 ( VM ) 为 2. 53,表明 
变量间的正相关，与组织有隶属关系的人的投票发生比比那些没有组织成员身 
份的人的投票发生比多了 2. 5倍多。 



第 2 章 I 对数线性模型 


设定模型 

一个模型-在我们所使用的这个术语的本来意义上——就是一个对列 

联表单兀格期望频数 ( Fij ) 的陈述，而单元格期望频数是呈现类别变量所描述的 
特征以及它们彼此关系的参数的函数。这些参数与上面讨论的发生比和优比 
有关，我们将做简要阐述。在评估一个模型如何很好地“解释，，或拟合数据时， 
我们主要关注模型的期望频数 ( Fp 在多大程度上近似于实际观测频数 (fij ) 。在 
第3章中，我们将思考如何评估模型对数据的拟合优度，但在这之前，我们必须 
首先阐述一些能够生成期望频数的方法和技术。 

目前主要有两种方法可以将列联表数据对数线性模型化 ：（1) 一般对数线 
性模型，这种模型不区分因变量和自变量。所有的变量都被同等地当成“响应 
变量”来考察它们之间的相互关系。在一般对数线性模型里，有待分析的标准 
是单元格期望频数 ( F y )， 它是模型中所有变量的函数。我们将首先阐述这种方 
法’因为它是第二种方法的基础。 （2) logit 模型。在此模型中 ，一 个变量被选做 
因变量。有待分析的标准是期望发生比(仏），它是其他自变量的函数。 logit 模 
型非常接近一般回归分析。对这一方法的详细阐述必须等到对一般对数线性 
模型进行了说明之后。引申开来的话，就有可能选出两个变量作为相关变量， 
并分析它们之间作为其他变量函数的相互关系。 

饱和模型 

我们通过展现一个适用于 2 X 2 交互表的可能模型来开始我们对模型的讨 
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论，例如表 1. 1。这个模型之所以被认为是一个饱和模型，是因为所有可能的效 
应参数都进人了模型，它的形式为： 


_ V M VM 

^ij = TjT x T] r；j 


[ 2 . 1 ] 


Fu 代表如果模型正确，在单元格 U j 中期望出现的数值或个案频数。7是表格 
的每个单元格中案例数目的几何平均数，这一项非常类似回归公式中的截距 
项。它是测量影响效应的基准或起点，而它本身并没有实质性的含义。 r 项表 
示变量对单元格频数的“影响”。这些效应参数都与上面讨论的发生比和优比 
有关。如果投票变量在成员身份变量各类别上的分布平均而言不相等（非矩 
形），那么就存在 J 效应(投票变量 V 的每个层次 i 的效应）。如果成员身份变 
量在投票变量各类别上的分布平均而言不相等(非矩形），那么就存在 < 效应 
(成员身份变量 M 每个类别 j 的效应）。最后， rf 1 效应(表格每个单元格卩的效 
应)在一定程度上表明投票和成员身份之间不是独立的（如，是相关的）。基于 
这 9 个效应参数，表 1 . 1 中 4 个单元格期望频数可以通过表 2 . 1 中列岀的模型 
表示岀来。 

要注意的是，在这个模型中（像在所有对数线性模型中一样），单元格频数 
(或单元格期望频数)被表示为一系列项的乘积。除了用^项表示平均或基准单 
元格频数外，效应的大小可以通过对数值 1. 00的偏离程度来测量。如果效应正 
好为1.00,则表示没有影响，因为乘积没有改变。如果没有影响，那么每个单元 
格频数都与其他单元格频数相等，并都等于7项的值。如果效应参数在一定程 
度上大于 1. 00,则那个单元格中的数值就会多于期望的平均案例数，然而，如果 
r 参数小于 1. 00,那么那个单元格的数值就会少于期望的平均案例数。 


表 2.1 饱和模型的单元格期望频数 




成员身份 ( M ) 




一个或更多 


没有 

投票参与 
( V ) 

投票 

没有投票 

t? V M VM 

Til = TpTi n rn 

T? V M VM 

^ 2i = rjr 2 Ti t 2 \ 

F12 = 

F22 = 

V M VM 

- rjT \ Z 2 ^12 

V M VM 

一 7 1 " 2 r 2 r22 





对数线性模型 


对于二分变量，诸如成员身份和投票参与，每个变量两个类别的效应参数 r 
互为 倒数： 


r v = r v = 1/r v [2. 2] 

r M = / = 1/r M [2. 3] 

r 的下标值指代 r 所对应的变量的类别。因此，就是变量“投票参与，，的第一个 
类别(“投票”) Xt 单元格期望频数的影响，而它的倒数 g 就是“投票参与，，的第二个 
类别(“不投票”)的影响。对公式 2. 2和公式 2. 3的限制性条件可以确保“投票参 
与”变量两个层次 r v 的乘积和“成员身份”变量两个层次 r M 的乘积都等于 1. 00。 
同理，的 4 个值具有以下 3 个限制性条件，所以它们的联合乘积也为 L ⑻： 

r VM = r VM = ^ = l/r VM = 1/r VM [2. 4] 

因为效应参数 (9 个)多于单元格频数 (4 个），因此，如果没有上述的5个限 
制性条件(公式 2. 1到公式 2. 4)，那么这个饱和模型是不能被估计岀来的。这 
些限制性条件意味着只有4个效应参数是独立的(分别为 V 、 M 和 VM )。 有 
了这4个独立的效应参数和表中4个单元格，饱和模型将再生产岀观测单元格 
频数而不会剩余自由度(模型检验的自由度将会在下面的部分讨论，一般而言， 
等于1的 r 参数的数目决定了自由度）。因此对于任何列联表，我们可以将观测 
值心等同于饱和模型中的期望值 Fij 。 当我们设定其他模型来估计单元格期望 
频数，而这些模型需要的效应参数又少于列联表单元格数目时，我们就能获得 
用于检验模型数据与观测数据之间拟合性的自由度。 

运用表 2. 1中的等式，我们能够推导出基于（期 望） 单元格频数的 r 效应 

参数的公式。通过这种方式，效应参数所代表的含义能够更清晰地显现出 

来。为了解释投票 成员身份相关性的效应参数，我们使用先前提到的期 

望 优比： 

0 ^ =期望优比 ( VM ) = [ 2 . 5] 

F 2 i f 12 f 12 / f 22 

这个期望优比的结果先前得岀为 2. 531( 因为在饱和模型中，观测频数与期望频 
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数是相同的）。下一步，我们用表 2. 1中的4个等式来代替4 fFij 并加以 简化： 

F11/F21 _ (Tyr^r^r ^ 1 )( 7 yr^r^r^> = r ^ 1 r ^ 1 [ 2 . 6 ] 

T7 /I7 / V M VM \ / V M VM \ VM VM 

^12/^22 KTjT 2 Ti T 2 \ / V^i V 2 T 12 ) T 2 \ T 12 

这个关系表明，这个优比只与 v 和 M 之间相关关系的大小和方向有关，而与这 
两个变量的边际分布无关。使用公式 2. 4中的恒等式，我们可以用单独一个二 
变量参数的函数重新写出这个 优比： 


或者 
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[2. 7] 


r vM = ( F n F 22 / F 21 F 12 ) 


[ 2 . 8 ] 


因此，投票一成员身份共变关系的参数是模型中期望频数交互乘积比- 

即优比——的四次方根。在实例中，此值为1.261。 

接下来看单一变量的 r 参数、和 <，并依照与上面相同的步骤，我们可以 
得到那些项的表达式。我们从两个条件发生比的乘积 幵始： 


/ F n wFi 2 \_ _ ( dlul ) ( I 1 IK .) 


(^ 2 


或者 


r v = (Fn F12/F21F22) 1 


同样， 


r M = (FiiF 2 i/Fi 2 F22) + 

通过将前述关于 V 的等式乘以 （ F u F 12 / F n F 12 ■，关于 M 的等式乘以 （ F u F 21 / 

F u F 21 ) 、我 们可以得到一个替代性的表达式，这个表达式可以使我们进一步深 
入理解 r 参数的意义。这一步操作表明， r 系数表示的是变量一个类别中期望 
案例数与交互表所有类别中期望案例数几何平均数的比率。因此， 
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(FiiFa )^~ 
(Fn F12F21F22) 4 


或者 


(FijFzj 

(F11F12F21F22) 4 


[2. 9] 


[ 2 . 10 ] 


这些公式再次保证了一个变量的 r 参数的乘积等于 1. 00。 r 效应值越远离 
1. 00,边际类别就越不可能拥有 1/ K 个样本案例， K 是一个变量具有的类别数 
目（二类别变量的 K = 2)。换句话说， r 参数反映了案例在变量类别间分布的 
偏态大小。 

最后，通过相似的步骤，在每个单元格期望频数的公式中，常 数项彳 就只是 
所有(期望)单元格频数的几何平均数(几何平均数就是 n 个数乘积的 n 次方 
根)。由于在我们举例的 2 X 2 表中有4个单元格，所以7值就等于4个单元格 
期望频数乘积的四次方根。因为在饱和模型中，单元格期望频数与观测单元格 
频数相等，所以我们现在就能计算出所有的参数估 计值： 


八 

V = 

(fll fl2f21 f22 ) ’ = 

: 331. 657 

V 

= 

1 

r 

_ ( fll fl2 ) 2 

/\ 

V 

= 1. 366 

M 

T\ = 

1 

~M = 

_ (fll f2i ) 2 

八 

V 

=1. 205 


_VM _ _VM _ j _ 1 _ / fll U2 \ w! 

r ll — r 2 2 — VM — ~VM — I f r ) = I. Zbl 

Tu r 2 i M21I12 / 

使用这些估计(没有四舍五入），我们可以准确地再现 4 个单元格 频数: 

Fn ~ (331. 657)(1. 366)(1. 205)(1. 261) = 689 


F12 = (331. 657)(1. 366)(1/1. 205)(1/1. 261) = 298 
F21 = (331. 657)(1/1. 366)(1. 205)(1/1. 261) = 232 
F22 = (331. 657)(1/1. 366)(1/1. 205)(1. 261) = 254 



在进入 2 X 2 表的非饱和模型讨论之前，我们将对这些估计值做进一步的 
检视。 ，参 数代表“投票”变量两个条件发生比的几何平均数的二次方根。在 
这种情况下，平均条件发生比在某种程度上要比即使从样本中随机抽取一个 
人，也就是在1976年参加了投票的情况好一些(大于1 : 1)。需要注意的是，这 
个条件发生比并不等于从边际行总数中计算岀来的非条件发生比 2. 03。条件 
发生比考虑了表格中其他变量的案例分布，而边际(非条件)发生比并不能反映 
数据中其他因素的存在情况。效应大于 1. 00,表明平均而言最少属于一个社 
团组织的人的数量要多于不属于任何组织的人的数量。最后，代表属于一些 
社团的人的投票发生比与不属于任何社团的人的投票发生比的对比。或者说， 
这个效应和与之相伴随的优比可以被看做当一个人已经投票的情况下，他/她 
属于社团组织的发生比。在一般对数线性模型中，没有变量被认为取决于其他 
变量。因此，两个解释中的任何一个都是合理的。然而接下来，我们将把投票 
看做是取决于其他变量的一种结果。 

非饱和模型 

一个饱和模型将交互表的单元格频数表示为对于一般均值（彳)，每个变量 
和它们之间相互关系的效应的函数。但是饱和模型没有简约性，因为它完全用 
C 个效应来代表 C 个单元格。从饱和模型中得出的期望频数总是完全匹配观 
测频数。可以通过设定一些效应参数为 1. 00的方式来构建更加简洁和简单的 
模型，这类似于在回归分析中事先指定一个回归系数等于 0( 例如，假设一个特 
定的变量对因变量没有影响）。这样的非饱和模型得到的期望频数一般或多或 
少会与观测数据不一致。下一部分我们将考虑如何评估模型对数据的拟合 
优度。 

在关于表 1. 1数据的几个非饱和模型中，有一个模型将二变量参数设定为 
1. 00( 设定一个= 1. ⑻，就自动将其他3个也设定为 1. 00,这是因为受到限 
定性条件的作用）。在这个模型中参与投票和组织成员 g 份被假定为不相关， 
这是因为它们的关系通过了二维表中关于独立性的传统卡方检验的验证。在 
这个模型下，单元格期望频 数为： 
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F ；J = r,rUT [ 2 . 11] 

其他 r 被设定为 1. 00 的另外的模型 包括： 

Fij = rjr^ [2. 12] 

Fy = rjz^ [2. 13] 

Fij = rj [2. 14] 

公式 2. 1 和公式 2. 11 到公式 2. 14 给岀的 5 个模型是用来检验关于表 1. 1两个 
变量间关系的各种假设所必需的完整集合。需要注意的是，不可能岀现在包含 
r 高阶 r (如 r ^) 的同时却没有包含嵌人其中的低阶 r (如 r v 和 r M ) 的模型。在 
接下来的部分，我们将对对数线性分析的层次性特征进行更全面的讨论，并将 
描述检验非分层模型的程序步骤。但我们将不考虑诸如 F „ = rjz ^ 这样的 
模型。 

我们上面讨论的各种一般对数线性模型都是通过乘法的形式表示岀来的。 
我们注意到，如果对所有的项取它们的自然对数，就可以将这些等式转化为线 
性等式。也就是说，这些等式在它们的对数形式上是线性的 （ Ln ， 因此称为“对 

数线性”），这就是这种方法名称的来源。在古德曼的表达式中，公式 2. 15具有 
对数线性的 形式： 


F, = L2. 15 」 

LnCFij) = LnC^r^rf r^ 1 ) = Ln(^) + Ln(r^) + Ln(rf) + Ln(r^) 

或者 

Gy =0+W + 入， C2. 16] 

在此式中，; V 是 z ■的对数是 7 的对数， Gy 是 Fy 的对数。非饱和模型具有相同 
的对数线性表达式。这些对数线性的形式更类似于一般回 归:单 元格期望频数 
的对数是常数项加上每个变量项和变量间相互关系项的一个加法函数。因为 
1. 00 的自然对数为 0, 所以模型中一个 x 效应的缺失就等同于这个参数的一个 
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值为0,就如同在一般回归中一个没有影响的变量的斜率为0 —样。 

乘法和加法的对数形式在数学上是等同的。乘法形式的概念优势在于，它 
接近于模型动机之下的发生比和优比基础。因为这两种形式在社会科学领域 
可以通用，所以读者应该对这两种表达式体系都有所了解。 

在饱和模型中的效应参数的统计显著性在它们的对数线性形式下最容易 
被断定(如 X 效应参数） 。： V 的标准误可以通过如下的公式来估计 ( Goodman ， 
1972 b ：1048)： 


i i_ 

c 2 


其中， c 是列联表中单元格的数目。对于大样本而言，如果 X 的期望值为 0( 如 
1.00), 那么标准化的 X ( 如 A / S x ) 就近似一个由均值0和单位方差所决定 
的正态分布。因此，与一般回归一样，一个大于 ±1. 96的标准化 X 将在 
p = 0. 05的显著性水平上显著。虽然这样的标准化只严格适用于饱和模型，但 
s x 为非饱和模型参数的显著性检验提供了一个检验统计量的上限。对于表 1. 1 
而言，= 0. 029。对饱和模型的3个 r 取对数，并除以这个标准误，将得到较 
大的标准化值，这表明全部3个效应都高度显著。 


拟合边际 

现在，我们介绍一种描述模型的常规表达式，这一表达式不必像上一节那 
样使用单元格频数公式。首先，我们详细阐述一下分层结构的概念。当在数据 
中呈现一个复杂的多变量间关系必须包括相对简单的交互关系时，就存在模型 
的层次性。举例而言，在一个四变量的交互表中，如果一个包括投票、成员身份 
和教育变量三维交互 ( r 胃) 项的分层模型被设定，那么这个模型的公式中就一 
定也会包括所有二变量的参数 ( r _、 和 r ^) 和单变量的效应(，、，和 r E )， 
当然还有总的均值效应 7 。在分层结构中，模型中包含高阶关系，这就潜在地包 
含了由组成这些高阶关系的要素构成的低阶效应的所有组合。对数线性方法 
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同时包括了分层的和非分层的两种取向，但一般而言，前一种方法更为人们所 
偏爱，其中的原因我们将稍后讨论。实际上，一些对数线性估计方法不允许研 
究者在纳入高阶相关性时，忽略嵌入在这些关系中的低阶项。 

描述这些模型更简便的表达式是使用代表交互表中特定变量的字母。这 
种表达式是将模型假设有相关关系的变量的代表字母放在大括号或圆括号中。 
每一组带括号的字母表示模型中所包含的最高阶的效应参数(例如，在乘法形 
式中没有被假设为 1. 00、在加法形式中没有被假设为0的 r )。 由于层次性要 

求，括号中的一组字母可以表示所有必须呈现的低阶关系。举例来说，针对表 
1.1 数据的饱和模型写成公式 2. 17 为： 

F,= [ 2 . 17] 

在标准表达式中，它的表示方式为 {VM }。 通过将 V 和 M 都放入到一对相同的 
括号中(字母的顺序并不重要），我们为投票变量 { V} 确定了单变量 r 参数，为成 
员身份 { M } 确定了参数 7 。如果在公式 2. 11中的模型被假设，表达式就是简单 
的 {V}{M }。 因为代表投票和成员身份变量的字母并没有在同一个括号里岀 
现，我们将其解释为这是一个假设 V 和 M 互不相关的模型，虽然 V 和 M 两者 
的边际发生比可能并不等于 1. 00。为了将这个表达式扩展应用于有种族、教 
育 、成员身份和投票参与四维交互的表格中，饱和模型就表示为 {REMV }。 如 
果研究者认为，四维交互并不必然能拟合数据但需要所有三维的交互作用，新 
模型将被简写成 { REM} {REV} {RMV}{ EMV} 。 在一个大大简化了的模型中， 
如 {EV} {EM} {R} ，我们能很快地看岀，四维和三维的交互作用都被假设为不存 
在，大部分二维的交互作用也不存在。对于种族变量而言，只有边际发生比被 
假设为对拟合数据是必需的。 

除了表达的简洁性之外，对数线性模型的标准表达式也传递出这个分析方 
法的另一个重要特征。括号中的变量标明了从完整的交互表格中形成的子表 
格(“边际”表格）。在用给定的假设模型对完整表格进行单元格频数估计时，在 
指定的边际单元格中的期望频数 ( FJ 必须完全与相同子表格集合中相应的观 
测频数(^)相等。用于估计期望频数的程序步骤(将在下一节进行描述)保证了 
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期望频数与特定边际单元格中的观测频数总是拟合的。因此，标准表达式经常 
被称为“拟合边际表达式”。 

这个概念存在于对二维表(如表 1. 1中的 V - M 交互表)进行的传统的卡方 
独立性检验中。在这个检验中，对单元格期望频数的一个要求是，它们相加的 
总和为观测行与列的边际频数。在标准的对数线性表达式中，关于变量独立性 
的模型， { V }{ M } 意味着通过模型“拟合”数据关于投票和成员身份两个单变量 
的边际分布必须正好等于交互表中观测到的行列的加总。如果模型 { V }{ M } 可 
以拟合表 1. 1的数据，那么将发现如下的期望 频数： 


投票参与 
( V ) 


投票 


没有投票 


成员身份 ( M ) 
一个或更多 没有 


617 . 13 

369 . 87 

303 . 87 

182 . 13 


921 552 


合计 

987 

486 

1473 


虽然这个模型中的 F tj 与^不一致，但通过行列拆分(相加)得到的边际值却等于 
观测数据。同时需要注意的是，期望频数的优比为 1. 00,与模型的假设= 


1. 00相符，说明这两个变量不相关。 


一个二维表的“边际”很明显就是行或列的总和，这些总和对应于各个变量 
各类别的案例分布。在多维的交互表中，边际是指将较大的表格拆分而形成的 



达式中所假设的模式。一个饱和的对数线性模型甚至也有一个拟合边际表格， 
它正好与观测表格相等，因此对于饱和模型而言，拟合单元格频数与观测单元 
格频数是等值的。 


我们可以用一个有种族、教育、成员身份和投票参与变量的完整四维表格 
来说明其中的一些原理，这个四维表的观测频数显示在表 2. 2中。假定我们假 
设投票变量与成员身份变量单独相关，并与种族和教育变量联合相关(例如，一 
个三变量的交互作用），同时种族、教育和成员身份变量两两相关。在拟合边际 
表达式里，这个模型就是 { VM } { VRE } { REM } 。简单来讲，就是通过使用一个 
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程序来估计在这个模型下的期望频数，我们将这些期望频数显示在表 2. 3中。 
我们留给读者自己去证明以下 提法: 如果期望频数 F iikl 的适合项相加产生模型 
所拟合的3个边际值，结果将正好与观测频数边际总和相等。同时也要注意，嵌 
入在高阶边际中的低阶相关——如 { VR } { RE } 和 { EM } ——在观测数据和模型 
化数据之间也是相等的。 


表 2. 2种族、教育、成员身份和投票参与交互表 


种族 

教育 

成员身份 

投票参与 

投 票 

没有投票 

白人 

低于高中 

没有 

114 

122 

白人 

低于高中 

一个或更多 

150 

67 

白人 

高中毕业 

没有 

88 

72 

白人 

高中毕业 

一个或更多 

208 

83 

白人 

大学 

没有 

58 

18 

白人 

大学 

一个或更多 

264 

60 

黑人 

低于高中 

没有 

23 

31 

黑人 

低于高中 

一个或更多 

22 

7 

黑人 

高中毕业 

没有 

12 

7 

黑人 

高中毕业 

一个或更多 

21 

5 

黑人 

大学 

没有 

3 

4 

黑人 

大学 

一个或更多 

24 

10 



表 2. 3 

模型 { VM } { VER } { ERM } 的单元格期望频数 

种 族 

教 

育 成员身份 

投 票 没有投票 


白人 

低于高中 

白人 

低于高中 

白人 

高中毕业 

白人 

高中毕业 

白人 

大学 

白人 

大学 

黑人 

低于高中 

黑人 

低于高中 

黑人 

高中毕业 

黑人 

高中毕业 

黑人 

大学 

黑人 

大学 


没有 

一个或更多 
没有 

一个或更多 
没有 

一个或更多 
没有 

一个或更多 
没有 

一个或更多 
没有 

一个或更多 


116. 76 

119.23 

147. 24 

69. 77 

88.82 

73. 18 

209. 18 

81. 82 

52.82 

23. 18 

269. 18 

54.82 

25. 77 

28. 23 

19.23 

9. 77 

12. 27 

6. 73 

20. 73 

5.27 

3.55 

3. 45 

23. 45 

10.55 


生成期望頻数 


现在我们需要解释一个假设模型如何产生期望频数。对一些简单的模型 
而言，比如上面所检验的二变量模型，存在一些可以对非饱和模型进行直接估 
计的简单公式。但对于较大的表格和更复杂的模型，就需要运用一些算法来获 
得模型的期望频数。两种常用的程序分别为费伊 ( Fay ) 和古德曼在 ECTA 程序 
中运用的迭代比例拟合算法、戴明一斯蒂芬算法和运用在 MULTIQUAL 程序 
中的牛顿一拉夫逊算法。虽然牛顿一拉夫逊过程更具一般性，但我们将更多地 
讨论更简单和更经常使用的迭代比例拟合算法。 

迭代比例拟合算法的计算机执行过程相当复杂，在这里我们不做介绍 
( Davis , 1974： 227—231； Bishop et al . ， 1975： 57—122； Goodman , 1972 b ： 

1080 一 1085； Fienberg ，1977:33 — 36)。 这个程序运用由模型拟合的边际表格 
来保证在其他各个变量上的期望频数总和等于对应的观测边际频数总和。不 
受模型的拟合边际限制的变量的期望发生比和优比都等于 1. 00。 

迭代比例拟合过程为分层模型产生单元格期望频数的最大似然估计 
( MLE )。 虽然对 MLE 技术的阐述超岀了本书的范围，但这些程序可以产生一 
致、有效的统计估计值，而一致性和有效性在理论上是非常理想的统计估计值 
的标准 (Bishop et . al . ，1975:58)。单元格期望频数的初步估计被成功地加以 
调整，以拟合模型中所确定的每个边际子表格。通常，所有的单元格最初都被 
估计为1。因为转化成最终的估计值非常迅速，很少会岀现问题。稍后，我们将 
给岀使用不同起始值时所做的分析。因此，在模型 { VM }{ VRE }{ REM } 中，最 
初的估计值首先被调整以拟合 { VM } 的观测频数，然后去拟合 { VRE } 的观测频 
数，最后拟合 { REM } 的观测频数。然而在每次新的拟合中，前一次的调整都会 
变得有些扭曲，所以这个过程会从最新的单元格估计开始再进行一遍。每一轮 
都将会有一些改进，直到在现在的估计值和前一个估计值之间达到一个任意小 
的差别，这时，这个过程才会结束。这种最小似然估计算法总能使期望频数连 
续估计值之间的差异达到所期望的那样小。虽然戴维斯 （ Davis ，1974) 提供了 
用袖珍计算器进行计算所需要的准则，但是只有最简单的问题才可以在不使用 
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高速计算机的条件下完成。 

当程序为一个给定的模型设定生成了期望频数巧之后，这些数字将通过程序 
进入合适的公式中，为变量和它们之间的交互项生成效应参数估计值 ( r 或者入)。 

分析发生比 

目前，我们只处理一般对数线性模型。在这种模型中，所有的变量都同样 
被当做响应变量，它们之间的关系是由全部变量集合的乘积或相加函数所决定 
的。用效应参数建构模型的标准是单元格期望频数 ( F 0。 我们现在转向对数 
线性模型的第二个主要类型，即一般对数线性模型的一个特例—— logit 模型。 
在 logit 模型中使用的是类别变量，类似于处理连续因变量的一般线性回归。因 
此，古德曼 (1972) 称它为“一种改进的回归方法”。在这个模型中，一个变量在 
概念上被认为取决于其他变量引起的变化。在这个模型中分析的标准是因变 
量单元格期望频数的发生比。更准确地说，我们讨论的模型与发生比的对数有 
关，这个发生比的对数就叫做 logit 。 通常， logit 被界定为发生比对数的1/2。 

然而，古德曼采用了分析发生比对数的一般惯例，我们在本书中沿用此法 
( Goodman , 1972: 35) 0 

为了将 logit 模型与一般对数线性模型做对比，我们考虑包含投票、自愿性 
社团成员身份和种族三变量的例子。投票变量将被概念化为因变量，它的发生 
比是成员身份和种族的函数。在对数线性(饱和)模型下，单元格期望频数 F ijk 
是多个效应参数的函数。因此， 

17 — V M R VM VR MR VMR 

rijk — r/Ti rj r k rjj r ik r jk r ijk 

现在，如果我们用这些单元格期望频数来产生投票的期望发生比，那么，我们将 
得到如下 结果： 


VMRVMVRMRV1V 

£iik = T] r k zYi r lk r ik r lik 

FV, — v M R VM VR MR V1V 

r 2 J k 7 r 2 T ) T 2] r 2k r jk r 2jk 


一旦这个公式上下的公共项被删除，我们就能得到一个简化的表 达式: 
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^ V VM VR VMR 

Pljk — ^1 ^li ^lk ^ljk 
T7 — V VM VR VMR 

^2jk r 2 r 2j r 2k r 2jk 


在前面介绍的给定的进一步限制性条件下达到可识别性，这个表达式可进一步 
简 化为： 


= (r V ) 2 (r VM ) 2 (r VR)2 (r VMR ) 2 

^2 jk 


通过取对数 可得: 




= 2 Ln ( r v ) +2 Ln ( r ^) +2 Ln ( rr > +2^(^) 


或 

Ln^ = 2X V + 2X^ + 2X^ + 2^ 

其中 X 是 r 的自然对数。用古德曼 (1972) 的表达式将这个公式重新表示出来可 
以 得到： 

我们可以看出，在对数线性模型的效应参数和 logit 模型的参数之间存在直接 
的关系。是投票(条件)发生比的对数4对应 X ，比如，纩= 2 X V , ^ = 2^ 

为了展现 logit 模型和一般对数线性模型之间的区别，我们将分析四变量的 
数据。假定我们假设参加投票的发生比取决于成员身份、种族、教育以及种族 
和教育的交互作用，那么，这个模型的 logit 公式用古德曼表达式表示，就 为： 


<=/? v +r +/r +， lz * 15J 

这里，是投票参与期望发生比的对数。与等价的对数线性模型所受的制 

约一致，影响 V 的每个因素的 P 的总和为0。例如，由于教育有3个类别，所以 
#+#+# = 0。 

bgit 模型的一个重要方面在公式 2. 18中没有显现出来，那就是所有自变 
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量之间的三维交互作用 { REM } 是通过所有包含了较少边际项的 {RE }、 { RM }、 
{ EM }、{ R }、{ E }、{ M } 表现出来的。这些因素项在求解投票变量期望发生比 
的 logit 方程中并不会出现，但这些边际必须在估计作为发生比基础的期望频数 
时被拟合。即使有些因素在统计上不显著(显著性的标准将在下一节中讨 论）， 
但是那些全部自变量在其中产生交互作用的边际表格也都必须被包含进所有 
logit 模型中。这种包含关系是 logit 模型与对数线性模型之间的一个主要区 
别，原因如下所示。用四变量例子中的拟合边际表达式(解释如上），我们可以 
比较下面的两个 模型： { VMER } 和 { V }{ MER }。 其中第一个是包含了所有效应 
的饱和模型。第二个模型则受到一种非常特殊的限制。以下效应都被假设为0 
(不存 在): { VM }{ VE }{ VR }{ VME }{ VER }{ VMR }{ VMER }， l ^ i ^， J ^|^ 

及投票参与的相关关系和交互关系的效应都被假设为0,并且这些都是后一个 
模型中被假设为0的唯一效应。如果我们想要检验任何涉及V的效应是不是 
准确地模型化数据所必需的，那么，这些检验将通过与一个基准模型，如 
{MER}， 进行比较而得以实现，这个基准模型包含的仅仅是 (并 且全 部是) 不涉 
及因变量的关系。这个对数线性程序与回归分析类似，因为尽管自变量间的相 
关关系没有明确地出现在回归方程中，但这些关系其实已经被考虑进来了。 

公式 2. 18的参数估计，如同在一般对数线性模型中一样，开始于拟合假设 
所提出的边际以得到期望频数。拟合边际 {MER}{ERV}{MV} 产生了表 2. 3 
中的期望值。要注意 logits 的宽广值域，它涵盖了从没有高中学历和社团成员 
身份的黑人的一 0. 09[= Ln(25. 77/28. 23)] 到具有大学学历和一些社团成员 
身份的白人的1_ 59[= Ln(269. 18/54. 82)]。为了取得值，我们运用如下公式 
对适合的 r 值进行转换(其中， Q 代表影响V的其他变 量）： 

『= 2Lnr VQ 

因为古德曼对 logit 的定义是一般定义值的两倍，因此，表 2 . 4 给出了公式 2 . 17 
模型的相关 r 值和与它们等价的值。 

一个对数线性程序，如 ECTA， 能够被用来以两种算法中的一种去估计 
logit 模型中的值。以前面建议的方法可以得到 x 的估计值，这些值的两倍就 
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得到等价的 P 值。另一种方法，因变量的发生比可以作为观测值直接读入，在这 
种情况下，一般对数线性模型加法形式中的 X 值就直接等价于 logit 模型(使用 
古德曼的表达式)中的值。不论采用两种方法中的哪一种，模型对数据的拟合 
都将是相同的。 

为了表明这些参数准确地再生成了期望发生比，让我们将高中毕业并具有 
一些社团成员身份的黑人的表达式写出来。这些应答者在1976年参加投票的 
期望发生比是 20. 73 : 5. 27, logit 值为 1. 37。这个 logit 值的公 式是： 

表 2.4 模型 {VM}{VER}{ERM} 的 r 和参数 


项 


V 

VM 


rn 

VR 

Tn 

VE 

Tn 

VE 

[12 

VE 

Tn 

VEF 

rni 

VEF 

『121 

VEF 

ri3i 




1.375 

0. 636 

0.825 

_ 0. 385 

1. 037 

0. 073 

0.857 

— 0. 309 

1. 069 

0. 133 

1.091 

0. 174 

0. 982 

— 0. 036 

0. 866 

— 0. 288 

1. 176 

0. 324 


注: 报告的参数值对应于 R 变量的第 1 层次(白人)和 M 变量的第 1 层次(一些成员身份）。其他层次 
的参数值可以通过取倒数(对于 7 T ) 或改变符号(对于辦的方式获得。 

插入适当的值(注意，当成员身份和种族在第2层次时正负符号的改变) 得到: 
^ 22 = 0. 636 + 0. 385 + 0. 133 - 0. 073 + 0. 288 = 1. 37 

对于 logit 模型参数的解释类似于对一般回归中叠加系数的解释。正的值 
表明，自变量或交互项提高了因变量的发生比，而负的值说明发生比降低了。 
因此，没有社团成员身份将大大降低投票率（一 0. 385)，而如果是白人，则会小 
幅提升投票率(0.073)。为了评估一个多类别自变量的影响，就必须考虑该改 
变量上所有的^值。低的教育水平将降低投票率 (一 0. 309)，而增加教育年限将 
提升投票的发生比'(高中毕业为 0. 133,大学为 0. 174)。交互作用能够以以上方 
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式中的一种加以解释。例如，^ = 0. 324 既可以被解释为大学教育在提高白 
人的投票参与率上要大于黑人，也可以被解释为，白人在接受过大学教育的应 
答者中提高的投票参与率要多于在只接受过较少教育的应答者中所提高的。 
这个系数本身并不能表明接受大学教育的白人比接受大学教育的黑人或接受 
低教育的白人有更高的投票率(虽然这也是正确的），它只表明单元格 231 的对 
数发生比的值比排除了这个效应的等价模型的期望值要大。这个等价模 型为： 

^> 2 V 31 =^+^+ 1 ^+^ 

这是解释效应参数的一个要点，并且有必要在这点上做一点扩展。考虑数据的 
一个假想表格(表 2. 5)，它表明了是或不是 A 与是或不是 B 之间的关系。如果 
我们计算表 2. 5的卡方值 (8. 56, df = 1)，我们将发现，在这两个变量之间有显 
著的相关关系，那些在 A 类别中的人也倾向于在 B 类别中。但要注意的是，这 
个陈述将同时在 A 和 B 中的54人的观测频数与这个单元格的期望频数 38. 72 
(基于边际分布)做对比。根据简单的原始频数，那些在 A 类中的人更有可能在 
非 B 类中(每个人都是 A 或非 A )。 一个对数据更详尽的描述会这样叙述 :“虽 
然大多数人都在非 B 类中，但是 A 类中的那些人相对而言却较不可能在这一类 
别中而更有可能在 B 类中。”在对数线性模型的背景下，我们必须清楚地知道效 
应参数表示的是在相对频数以及在相对发生比和优比中的差异。在表 2. 4中， 
成为 A 提高了某人成为 B 的机会(虽然成为 B 的机会仍然较低）。 


表 2. 5 A 和非 A 与 B 和非 B 之间的关系 


A 


B 

54 


(38. 72) 

非 B 

187 

(202. 28) 

合计 

241 

(241) 


非 A 

合计 

187 

241 

(202. 28) 

(241) 

1072 

1259 

(1056. 72) 

(1259) 

1259 

1500 

(1259) 

(1500) 


第 3 章 I 拟合检验 


评估模型对数据的拟合 

目前，我们已经清楚了如何用一般或 logit 形式来概念化对数线性模型以及 
如何使用公式和拟合边际表达式来表明变量间的关系。我们也讨论了如何得 
到期望频数的其他来源，可以用直接的公式，也可以通过迭代比例拟合计算机 
算法来得到。现在，我们讨论如何决定一个假设的模型是否合理有效地拟合了 
观测数据。比如，公式 2. 1以及公式 2. 11到公式 2. 14是5个应用于表 1. 1二 
维交互表的截然不同的模型，但这些模型中只有一个能够展现观测频数被生成 
的过程。我们的问题是确定哪个模型提供了最好的拟合性。 

这个问题可以通过对每一个模型产生的单元格期望频数 Fij 进行评估，并将 
它们与观测频数 &进 行比较来解决，一般使用皮尔逊卡方统计 （ x 2 ) 或似然比 
统计： 

L 2 =2泣1咐馬） 口. 1 ] 

L 2 比 X 2 更可取，因为：（1)期望频数是通过最大似然法估计得 到的； （2) 能够对 
L 2 进行特殊分离，以便对多维表格中的条件独立性进行更有力的检验。 L 2 服 
从乂 2 分布，其自由度 ( df ) 等于设定为 1. 00的 r 参数的数量(对单元格期望频数 
没有影响 ）( 参见 Davis , 1974, 对在多元对数线性模型中自由度决定因素的详细 
讨论)。 L 2 与可获得的自由度 df 相比越大，则期望频数偏离实际单元格频数就 
越多。因此，我们可以作岀总结 :如果 L 2 很大，则表明假设的模型不能很好地 
拟合数据，就应该将其作为变量间关系不充分的代表加以拒绝。 
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需要注意的是，这一检验策略通常与二维表中传统的卡方独立性检验一起 
被教授并与之正好相反，所以在决策过程中可能会造成一些困惑。在通常的卡 
方独立性检验中，我们尝试拒绝关于变量间无相关性的原假设，因此，我们希望 
发现一个相对于自由度而言较大的 X 2 值。但是，为了尽量找到描述交互表的最 
拟合的对数线性或 logit 模型，我们希望接受假设的模型，因此，我们想发现一个 
相对于自由度而言较小的 L 2 值。 

关于统计检验需要进一步注意的是 ，一 个可接受的对数线性模型是，它的 
单元格期望频数与观测数据之间不存在显著差异。结果，分析者在他/她愿意 
接受的第 I 类错误 ex 的水平上很难作出选择。特别是在打算将样本的结论推广 

到总体时，我们将 CX 值设定得非常小-诸如 P = 0. 05或 0. 01- 不愿意下结 

论认为存在差异关系，除非有很强的证据支持原假设是错误的。 

但是，寻找“最”拟合的模型的策略促使我们对第 n 类错误^产生了更大的 

兴趣，对此类错误的控制有可能较小。我们想要确认一个包含了所有正确关系 

的模型，但是如果犯第 n 类错误的概率很高，我们就很有可能在模型中将总体 

中存在的效应忽略掉。犯第 n 类错误的可能性可以通过增加样本量(一般不太 

可行，尤其是在用二手数据时)或通过增加犯第 I 类错误的机会来减少。第二 

种选择引起的困境是在模型中潜在地包含本来不应该包含的关系，因为这些关 

系反映的仅仅只是抽样差异。解决这一问题最常用的办法大概就是当犯第工 

类错误的概率大约在 0. 01到 0. 35之间时，就接受这个模型能够拟合数据。在 

更高的概率层次上，模型可能会“拟合过度”，即包含了不必要的参数 (Bisho p et 
al . ，1975： 324) 0 

为了说明模型检验的过程，我们将对表 1. 1 二维数据的全部5个模型进行 
评估。结果显示在表 3. 1中。5个模型中除了一个之外，其余的 L 2 值都太大而 
不能被接受。只有饱和模型1完全拟合了数据但使用了所有的自由度，讲出了 
数据中的故事。需要注意的是，为了评估一个饱和模型，我们必须将它的拟合 

优度与忽略了全部交互项的非饱和模型的拟合优度做 比较。 这种模型之间对 
比的策略将在下一节中探讨。 
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荈表数据分析 


相同数据不同模型的比较 

在对相同数据进行拟合的各种不同模型之间做明确比较，可以使我们更好 
地理解假设。对投票一成员身份交互表的5个模型(公式 2. 1和公式 2. 11到公 
式 2. 14) 两两进行比较来对关于数据中存在效应的一些假设进行检验。然而， 
这些假设相互之间并不是独立的。因为只有4个独立参数，而在5个模型之间 
有10个可能的比较(假设），很明显，这些比较会有重叠。比如，对公式 I 11和 
公式 2. 12比较的结果(对十的检验)显然不会独立于对公式 2. 13和公式 2. 14 

比较的结果(也是对^的检验，虽然在这个检验中， V 的效应没有被控制）。许 
多假设都是可能的，我们将考虑两个根本性问题，它们可以用表 3. 1中的 L 2 值 
来解答。 

表 3.1 表 1.1 数据的模型间比较 


模型 

拟合 

边际 

1 

效应参数 

r7 ， 

VM 

Tn 

似然比 

L 2 

d f. 

P 

1 

{VM} 

331. 66 

1. 37 

0. 83 

0. 80 

0. 00 

0 

— 

11 

{VHM} 

335. 25 

1. 43 

0. 77 

1. 00* 

66. 78 

1 

<0. 001 

12 

{V} 

346. 30 

1. 43 

1.00* 

1. 00 # 

160. 22 

2 

<0. 001 

13 

{M} 

356. 51 

1.00* 

1. 29 

1. 00 # 

240. 63 

2 

<0. 001 

14 

{ } 

368. 25 

1.00* 

1. 00* 

1. 00* 

334. 07 

3 

<0. 001 


注，表示假设设定为1.00。 


独立性假设 

针对表 1. 1给出的数据，最经常和最合理的问题就是，投票参与和组织成员 
身份之间是不是独立的？传统的卡方检验表明两者之间并不独立，如同表 3. 1 
第二行所示。但在对独立性假设的正式检验中，我们实际上是将模型1的结果 
与模型11进行比较。两个模型之间的差异，正如对比公式 2. 1和公式 2. 11所 
能看到的那样，就是项只存在于前者却不存于后者中。如果两个模型给出 
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了不同的 L 2 值，这可能仅仅是因为二变量相关的 r 参数反映了这些变量间显著 
的共变关系。实际上，将非成员的投票参与发生比与成员的投票参与发生比相 
比所得的优比必须与 1. 00有显著差异 （1. 00是在一般对数线性模型的乘法版 
本中 r 的“无效应”值)。 

对两个模型间差异的检验能够提取出 L 2 值并将它与自由度的差异值做对 
比。在 L 2 中的这个差异值的分布近似于 df ， 等于两个模型间 df 差异值的卡方 
变量的分布。举一个特别的例子，表 3. 1显示 AL 2 = (66. 78—0. 00) = 66. 78和 
△df = (1 — 0) = 1，在小于 0. 001的水平上高度显著。因此，我们可以拒绝原假 
设并下结论认为，投票参与和成员身份在这一样本所在的总体中显著相关。在 
实践中，我们应该将 L 2 值缩减1/3以将综合社会调查的非随机抽样设计考虑进 
来 (Stephan & McCarthy ， 1958)。然而，由于我们的分析只是说明演示性的，为 
方便起见，我们忽略了这一修正。在这个例子中，基本结论保持不变。 

相等边际分布假设 

这两个假设在对数线性框架中都能够被轻松地解决，虽然它们在这个特殊 
例子中没有多少实质性价值。比较公式 2. 11和公式 2. 12,它们的区别在于 ， r M 
参数在后者中被假设为不存在。这一项的值是不属于任何自愿性社团的人相 
对于属于社团的人的发生比的函数。在某种程度上，非成员是少数，观测的边 
际发生比将偏离1 •• 1，因此，项将小于1.00。这一偏离是否显著取决于只在 
有与没有此参数上存在区别的两个模型在似然比统计检验值上的差异。因为 
△ L 2 = 93. 44, Adf = 1,我们总结认为，边际在成员身份变量上是不均等分布 
的。关于投票参与变量上的相等边际分布假设的类似判断也能够被计算出来。 

以上检验的两种类型的假设都是关于单个参数效应的简单假设。更复杂 
的假设能够通过对两个模型间的全部参数集合同时进行比较的方式来检验。 
例如，通过比较模型 I 4 和模型11，我们能够一次检验全部边际差异。但对于渐 

增式检验，更频繁地应用是为了决定特定参数是否被要求为数据提供可接受的 
模型拟合优度。 
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更复杂的模型：多类别变量 


我们已经通过以其他3个变量为函数的投票变量的 logit 公式简要地考察 
了关于投票、成员身份、教育和种族的四维表格。对这种多维分析的一些额外 
特征需要有进一步的了解。首先要考虑饱和一般对数线性模型的公式： 

T7 — VMERVMVEVRMEMRER VME VMR VER MER VMER [3. 2] 

^ ijkl i D [ij Tjk pi r;jk Ajl ^jkl ^jkl ^ijkl 

值得一提的是，这个看着就非常复杂的公式突出了拟合边际表达式的优点。相 
同的模型可以用 { VMER } 简洁地表达岀来。 

需要注意的是，与二变量的等式 2. 1不同，一些参数被用来代表3个和4个 
变量之间可能的交互作用。这些交互项可以被概念化为条件关系:任何一对交 
互项优比的大小取决于第三或第四个变量的层次。比如， I 能够表示教育水 
平与成员身份之间的相互关系随着应答者的种族而改变，或者在教育上的种族 
差异随着成员身份的层次而变化，或者种族中的成员身份比例取决于教育。在 
实际例子中，研究者选择强调哪种解释取决于激发研究兴趣的理论问题。 

从统计学观点来看，交互效应是优比比率的函数。当一对变量在第三个变 
量的第一个层次上的优比不同于它们在第三个变量另一个层次上的优比时，那 
么，这个“优比比率”就将偏离1.00。然而，如果两个变量的优比在第三个变量 
的不同类别中保持不变，那么，交互作用的 r 参数将等于 1. 00。同其他效应一 
样，限制约束也作用于三变量的 r 参数， 例如： 




= r m 



~ r 122 



^212 



『221 




^112 



^121 



T 2U G22 


[3. 3] 


也就是说，当所有 3 个变量都是多类别变量时，只有一个独立的效应参数值将被 
计算岀来，并且，这个值或者它的倒数将被应用于3个多类别变量的所有8个组 
合中。 

当模型18中纳入了一个多类别(三类别)变量——教育，就会产生更复杂 
的情况。回想一下，多类别变量的 r 参数是一个数值的函 数:这 个数值或者它 
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的倒数。但三类别变量有两个自由度，因此必须计算两个特殊效应（或它们 
的倒数）。 

这3个 if 参数可以通过一些不同的方法被估计出来，这取决于在测量发生 
比时，变量的3个类别中的哪一个被选岀来作为“基 准”。 比如 ，一 个发生比可以 
将第一类别(低于高中）中的应答者与第二类别（高中毕业）中的应答者进行对 
比。第二个发生比可以将第一个类别与第三个类别（大学)进行对比。两个发 
生比相互之间是独立的。但第三个发生比，将类别二与类别三进行对比，可以 
从其他两个发生比中推导岀来。第一个发生比与第二个发生比的比率产生了 
接收大学教育的人相比于低于高中教育的人的发生比。因此，用3个类别就只 
有两个独立的发生比能被估计出来。一般来说，如果给定 K 个类别，就有 K 一 1 
个不同的参数或它们的倒数需要被计算。 

在决定计算哪个发生比以便估计公式 3. 2中的 r 参数时，我们运用在第2 
章中考虑的情况，即 r 参数表示在一个变量的某类别中的期望案例数与此变量 
所有类别期望案例数的几何平均值的比率。因此，3个$能够被 计算： 



[3. 4] 
[3. 5] 


rf = 


2 2 2 

丌丌丌 

i J 1 


_ Fjj31 _ 

(F 叫 F 砌 F 脚 ） 1/3 



[3. 6] 


符号 tc 表示各项的乘积。要注意的是，每个7■是其他两个 r 乘积的倒数，这是为 
了保证联合乘积等于 1.00： 


E 



zM ， 



[3. 7] 


如同二维表格的饱和模型1，四维表格的饱和模型18也可以通过事先设定 
一些 r 参数等于 1. 00( 即没有效应）的方法产生更简单的非饱和模型。即使只 
有 4 个变量和层次模型，也能够评估许多模型。表 3. 2运用拟合边际表达法呈 
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现了一部分模型的概况。我们作出的基本假设是投票参与 V 作为我们想要解 
释其模式的变量是其他3个变量的函数，这3个变量的每个模型都拟合了 
{ MER } 的边际表格。这就是我们先前在第2章中列出的 logit 模型的程序。其 
他的拟合边际都将 V 与一个或更多的自变量联系在一起。在下一节中，我们将 
讨论假设检验以确认数据的最佳拟合模型，但我们首先要处理在多变量交互表 
中如何决定自由度的问题。 

为了计算与模型相关的自由度，就必须知道每个变量的类别个数。在4个 
变量分别有 I 、 J 、 K 和 L 个类别的四维表中，可获得的自由度总数就是表中单 
元格的总数减去 1 或 （ I )( J ) (K)(L) 一 1 。 在我们所举的例子中，可获得的自由度 
就为 (M)(E)(R)(V) —1 = (2)(3)(2)(2)_1 = 23 。 当然，饱和模型总是不能获 
得自由度，因为所有设想的参数都可以自由变化以准确地拟合数据。当从数据 
中估计的参数数量减少时(通过设定相应的 r 为 1. 00,因此^等于0)，检验模型 
所需的自由度就会增加相等的数目。 

因此，判断任何给定模型的自由度，我们只需要考虑模型所具备的每个效 
应中包含的变量，计算每个变量的类别个数，将每个类别的个数减去1，再将各 
项相乘。以模型28为例，拟合边际表格 { MER }{ MV }{ EV }。 对于第一个子泰 
而言，成员身份和种族变量都有两个类别，教育有3个，所以用来拟合这个子表 
的自由度为 （2 — 1)(2 — 1)(3 —1) = 2。因为投票是个二分变量， { MV } 用了 
(2 —1)(2 —1) = 1个自由度，而 { EV } 需要 （3 —1)(2 —1) =2个自由度。但要 
记得在更高阶的关系中嵌入较低阶的关系，在这个例子中就是 { ME }、{ MR }、 
{ ER }、{ M }、{ V }、{ E } 和 { R }， 它们分别消耗了 2、1、2、1、1、2和1个额外的 
自由度，因此需要用15个自由度来拟合这个模型。因为可得的自由度总数为 
23,那么剩下用于检验这个模型的自由度就为8。作为一个检查，我们也可以计 
算不被此模型拟合的边际表格的自由度。 { RV } 有1个自由度， { MEV } 有2个， 
{ MRV } 有1个， { ERV } 有2个， { MERV } 有2个，加起来正好等于用于检验模型 

的8个自由度。如预料的那样，这两组自由度的总和正好是四变量例子中 
的23。 
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表 3. 2表 2. 2数据的一些模型 


模型 

拟合边际 

L 2 

d . f . 

P 

24 

{ MER }< V } 

104. 23 

11 

0. 00 

25 

{ MERHMV } 

37.44 

10 

0. 00 

26 

{ MER }{ EV } 

51. 92 

9 

0. 00 

27 

{ MER }{ RV } 

102. 21 

10 

0. 00 

28 

{ MER }{ MV }{ EV } 

10. 96 

8 

0. 20 

29 

{ MER }{ MV }{ RV } 

36. 74 

9 

0.00 

30 

{ MER }{ EV }{ RV } 

51. 11 

8 

0. 00 

31 

{ MER }{ MV }{ EV }{ RV } 

10. 66 

7 

0. 15 

32 

{ MER }{ MEV }{ RV } 

7. 83 

5 

0. 17 

33 

{ MER }{ MRV }{ EV } 

10.05 

6 

0. 12 

34 

{ MER }{ ERV }{ MV } 

4. 76 

5 

0. 45 

35 

{ MER }{ MEV }{ ERV } 

2. 07 

3 

>0. 50 


更复杂的假设 

许多关于成员身份、教育和种族对投票参与影响的假设都可以用诸如表 
3. 2中呈现出的那些模型来检验。在实际研究中 ，一 个数据分析者对研究模型 
的选择通常受理论和以前经验发现的引导。在缺少明确的关于变量间关系的 
事先假设时，我们仍然能够设计一个策略性的模型检验以对观测数据配以最优 
的拟合。有两种方法使用最普遍。一种方法是从饱和模型开始，连续地删除高 
阶交互项，直至不论分析者采用什么样的概率标准，此模型对数据的拟合优度 
都不能被接受为止。第二种方法是从最简单的模型开始，比如，只对单变量的 
边际表格拟合的模型，然后连续增加越来越复杂的交互项，直到获得一个可接 
受的拟合优度为止，这个拟合优度不会再随着增加新项而得到显著的改进。在 
理想状态下，两种方法将相交于一个相同的假设模型，此模型会成为从数据中 
观察到的关系的最佳解释。我们个人偏好第二种方法，因为它以更简洁的模型 
作为岀发点，将更加复杂的关系加入到相对简单的关系中，清晰地展现了我们 
应用于对数线性模型上的估计方法的分层结构。 
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因为我们已经将投票参与设定为四变量交互表中的因变量，一个有效的初 
始模型就是其中没有自变量与因变量有显著相关关系的模型。如果这个模型 
提供了一个可接受的拟合优度，那么就不需要其他检验了。检验这个假设模型 
的一般形式是两个拟合边际表格： 


{ 所有自变量 H 因变量 } 


在所举的特定例子中，为 { MER }{ V }。 

对这个模型拟合优度的检验是与替代性模型进行对比，在替代性模型中， 
因变量可以与所有自变量进行交互。这个替代性模型当然就是饱和模型，或者 
就是例子中的 { MERV }。 如果 L 2 上的差异相对于 df 上的差异是显著的，那么 
我们就总结说一个或更多的自变量(或者它们的交互作用)显著地影响了因变 
量，因此必须被纳入我们选择的最终模型中。 

对于四变量表格而言，相关的比较是在表 3. 2的模型24与饱和模型(没有 
显示出来，因为它没有自由度， L 2 =0.0) 之间进行的。因为两个模型间的差异 
△ L 2 = 104. 23,而 Adf 却只有11，所以我们必须拒绝模型24,并得出结论认为， 
投票变量的确与一个或更多自变量有关。 

另一组有待检验的每一个模型都加上一个涉及投票参与的单一二变量关 
系项。用模型25、模型26和模型27与模型24进行对比来决定成员身份、教育 
和种族是否对投票参与率有显著影响。与前面一样，统计检验的标准是在评估 
增加的参数时，增加的 L 2 值相对于损失的自由度而言是否显著(这一例子中是 
在 ot = 0. 05的水平上)。即使这些模型中没有一个能在可接受的水平上拟合四变 
量表，我们仍然可以决定特定的二变量效应是否必须被包含进随后的模型中。 

{ MV } 和 { EV } 相对于它们为了拟合新增效应而损失的自由度而言，显著地 
降低了 L 2 值，虽然模型25和模型26都不能对数据产生一个令人接受的全面拟 
合。我们总结认为，在四维交互表中，投票变量显著相关于成员身份和教育变 
量。然而，在模型24中加人 { RV } 使 L 2 值相对于一个自由度而言减少了 2. 02, 
因而在拟合优度上没有显著的提高。我们得到的结论是，投票参与和种族 
无关。 



对数线性模型丨 

I 35 

对最佳拟合模型的寻找继续在模型28、模型29和模型30中进行。每一个 
都包含了 2个或3个涉及投票变量并且可能的二变量关系。这些模型的拟合优 

度相对于自由度而言，其提高程度取决于它们与先前3个模型的比较，这3个模 
型只含有二变量边际表。 

我们可以预计到，模型29和模型30都包含 { RV } 边际表，都不能分别显著 
地提高模型25和模型26所获得的拟合优度。显然，我们将不能发现种族对投 
票的显著影响。然而，当与模型25和模型26相比较时，模型28的 L 2 值相对于 
自由度有一个明显的下降。因此，即使有一个二变量的关系保持不变，其他二 
变量的效应也是显著的。更重要的是，模型28对于整个四维表，有一个相当不 
错的全面拟合。实质上，这个模型表明，成员身份和教育都会影响投票，即使在 
不考虑相互之间的效应后。我们唯一剩下的问题是，其他更高阶的交互项是否 

也必须被包括进来？注意，当模型31与模型28进行对比时，再一次证明种族与 
投票无关。 

给定3个自变量，可以形成3个涉及投票参与的三变量交互项。模型32、 

模型33和模型34都分别包含一个三变量的交互项，再加上没有包括进交互项 
里的二变量边际(以确保分层结构能得以维持)。适当的检验是通过比较每个 
模型相对于模型31在拟合优度上的改善来进行的。虽然所有3个模型都对数 
据提供了令人接受的拟合，但不论是 { MEV } ，还是 { MRV } 的交互项，与更简洁 
的模型31相比，都没有显著地提高拟合优度(就这点而言，它们也没有优于更简 
单的模型28)。模型3 4 检验了 { ERV } 的交互作用，但却更存在问题。与模型31 
相比， AL 2 = 5. 90,但 Adf = 2 0 这个差异在 0. 06的概率层次上显著。 

我们很希望能总结说，教育和种族对投票的交互作用是呈现数据中产生的 
关系所必需的。但如果我们严格地坚持统计标准并尽量避免犯第 I 类错误，我 
们将拒绝模型34。因为它并不明显比模型31或模型28更好，因此，我们将接 
受没有交互效应的假设。我们好似遇到了一个灰色地带，在这里，激发研究的 
基本目标对我们所做结论的影响与严格统计推理对我们结论的影响一样的大。 

在缺乏用其他样本进行的验证分析以及缺乏任何能激发人兴趣的关于期望特 
定的三变量产生交互作用的理论论点的情况下，我们自己倾向于选择更简洁的 
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模型28,即 { MERHMVHEV }。 这个模型在不诉诸复杂的三变量交互的条件 
下，对全部交互表给出了一个令人满意的拟合优度。它也删除了种族 一 投票效 
应，这一效应被认为并不重要，但却必须在模型料中将它包括进去，因为它被纳 
入了 { ERV } 项的分层关系中。用另一个综合社会调查的数据重复这一分析可 
能有助于解决此问题。 


对大样本多元 R 2 的模拟 

根据我们的经验，当样本的规模不超过大部分全国性调查时(大约1500个 
样本），用确定模型显著性的 L 2 检验作为确定交互表中重要效应的一个指南是 
相当有效的。但是，有时候分析者对研究非常大的数据库更感兴趣，如全国人 
口普査报告。这时，判定最佳拟合模型的问题在于 L 2 与 N 是成比例的。因此， 
如果潜在样本有成千上万甚至百万，那么，实际上能拟合数据的唯一模型就是 
饱和模型，甚至当一些高阶交互作用非常小时也是如此。 

为了克服大样本的这一问题，分析者将运用对多元回归的决定系数 ( R 2 ) 模 
拟的方法进行模型选择。选择一个“基准”模型，它的 L 2 将作为一个比较标准 
用来判断通过尝试更复杂的替代模型在拟合优度上所取得的改善。这个基准 
V 显示了数据中不是由已经纳入到模型中的因素所引起的变异的大小。当替 
代模型所解释的基准 L 2 的比例较高（比如90%或更多)时，那么就可以判断，这 
个替代模型为数据提供了一个令人满意的拟合优度，尽管严格的统计检验表明 
替代模型中对期望频数有显著偏离。模拟 R 2 为： 

( L 2 基准模型）一 （ L 2 替代模型) [3. 8] 

( L 2 基准模型） 


为了显示这个技术的有效性，我们分析来自一份1970年性别 （ S ) 和种族 
( R ) 组群的职业分布 ( J ) 普查报告的数据，如表 3. 3所示，单元格频数的单位是 
千人。在选择基准模型时，我们倾向于设定一个只含有一维变量分布的模型， 
在本例中为 { JHS }{ R }。 基准 L 2 = 30905,自由度为13。一些二变量替代模型 
降低了 L 2 值： { JRHSR } 的 L 2 = 15431， { JS }{ SR } 的 L 2 = 9562, { JSHJR } 的 
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表 3. 3职业、性别和种族交互表(千人) 


职 业 

白人男性 

白人女性 

黑人男性 

黑人女性 

专业和管理人员 

13195 

5268 

425 

379 

办事员和销售员 

5865 

11587 

436 

712 

手工业者 

8985 

297 

606 

25 

操作、体力和服务工人 

13343 

8739 

2623 

2187 

农民和农场工人 

2267 

378 

191 

18 


资料 来源: 《当前人口报告》 P -23, No . 37, 1971年。 


L 2 = 3706。这3个模型分别解释了基准模型方差的50%、69%和88%。但实 
际上，这些比例并没有大到可以表明这3个模型中的任何一个可以解释观测频 
数的全部模式。然而，当二维边际的全部组合被拟合， { JS }{ JR }{ SR } 的 L 2 = 
1846 (df = 4) 时，解释了基准模型中94%的方差。实际上，这个模型显示了职 
业分布随着性别和种族的不同而存在差异，但是在种族内部，各种族间的性别 
差异是相似的，在性别内部，各性别间的种族差异也是相似的。 { SR } 意味着性 
别比在各种族间是不同的。这样，被解释的方差比例已经足够大到可以下结论 
说，这个模型对数据提供了一个可接受的拟合优度，而应用于饱和模型中的交 
互项只解释了基准模型方差的6%，以至于可以忽略不计(虽然它在统计上是显 
著的）。 



第 4 章 I 实际问题的应用 


对数线性模型的潜在运用几乎是无限的。任何交互表都可以使用前面章 
节中列出的基本技术进行分析。在这一部分，我们将讨论具有相当普遍吸引力 
的6种应用。虽然每一个议题都能够运用比呈现的格式所允许的形式更详尽的 
形式来展现，但希望我们简要的讨论能够为读者提供广阔的可能性，从而使他 
们自己愿意继续进行探索。 

对数线性模型的因果关系模型 

在描述对数线性技术如何被调整用以检验类别变量间的因果关系时，我们 
将假设读者熟悉递归因果模型(指那些不包含变量间“循环”或者相互影响的模 
型）的公式和路径图的常规表示法。关于这种模型的基础探讨，可以从邓肯 
(Duncan, 1996、 1975a) 和亚瑟 （Asher，1976) 的著作中找到。古德曼 （Good¬ 
man， 1973a、1973b、1979) 在路径分析和对数线性因果模型间进行区分的努力 
也取得了一些成功。然而这个推断是有问题的，原因如下：（1)当涉及多类别变 
量时，对数线性模型不能够将单一的值赋予因果 路径； （2) 对变量间非直接路径 
的效应大小的测量。每当一个推理严谨的假设能够利用变量间的单向因果顺 
序时，因果推论仍然有足够的吸引力使人们暂时性地运用此方法。 

变量间关系的因果模型的关键是递归效应图。在一个如图 4. 1的因果模型 
图中，被认为是其他变量原因的变量被放在结果变量的左边。单箭头直线从原 
因指向结果。被认为没有因果关系的变量用双箭头曲线连接起来，并且只能出 
现在图的左边。我们的因果模型是被一些假设所驱 动的: 应答者的年龄（表明 


他们的世代)和区域地点是他们所受正式教育年限的历史决定 因素; 教育通过 
向人们灌输民主价值理念和政治容忍规范，引发人们对公民自由的支持;在教 
育之外，世代因素和地域文化对公民自由信念也有独立影响。我们对有关公民 
自由倾向的 3 个前提原因之间可能会产生交互作用没有做事先的假设，但我们 
对检验它们存在的分析将保持一个开放的态度。 



对这个因果模型的检验是基于 1977 年综合社会调查的数据。为了便于说 
明， 4 个变量都被二分了 (Bishop etal . ，1975, 讨论了处理此类被拆分表格的潜 
在问题)。年龄被分为 39 岁和 39 岁 以下; 区域被分为美国南部 (包 括边 境州） 和 
美国其他 地区; 教育被分为高中教育及以下和大学教育及 以上; 最后 ，公民自由 
观念被简化为是否同意史都华 ( Stouffer ，1955) 在关于容 忍的经典研究中的一 
个测试问题。 

表 4. 1 中对数据的因果分析与一般的 logit 模型(类似于有一个因变量和一 
些自变量的回归分析)不同。因果模型必须对 4 个变量间的时间顺序加以考虑， 
将模型的连续演化与各种“被拆分”的表格相对应，这些表格是用特定的方法从 

完整表格中建立起来的。我们在一系列独立的阶段中展开分析，每个阶段的结 
果最终将被合并。 

从表格的左侧幵始，我们首先形成年龄和地域的二维表格并设定一 系列对 
数线性模型，以决定这些“事先被决定的”变量之间是否彼此相关。因为 { A } { R } 的 
L 2 =0.03, df = 1， 所以我们的结论为，这两个变量是独立的，在图中不应 该用双 
箭头曲线连接。在南部和南部以外的区域中，青年人的发生比大致是一样的。 



荈表数据分析 


表 4.1 年龄、地域、教育和公民自由交互表 



年轻 

南部 

非大学 

72 

71 

年轻 

南部 

大学 

55 

22 

年轻 

非南部 

非大学 

161 

92 

年轻 

非南部 

大学 

157 

25 

年长 

南部 

非大学 

65 

162 

年长 

南部 

大学 

23 

23 

年长 

非南部 

非大学 

197 

214 

年长 

非南部 

大学 

107 

32 


注 :年龄 二分为39岁及以下、40岁及以上。教育二分为12年或更少、13年或更多。南方是指普査区 
南方和边境各州的所有州。 

寻找最佳因果解释的下一步是分析由两个事先被决定的变量和在因果次 
序中的第一个因变量所形成的三维子表。虽然年龄和地域变量在前一阶段中 
被发现是独立的，但我们正在估计的 logit 模型要求所有关于原因前提变量的边 
际表格都要被自动拟合。因此，对年龄一地区一教育子表的因果结构分析必须 
包含 { AB } 边际表格。如表 4. 2所示，被检验的模型都涉及教育和两个前提变量 
之间的关系。年龄一教育和地区一教育两个相关关系都是显著的，并且按要求 
去拟合数据，但三维交互项作用并不明显。因此，这一阶段的模型就是 { AR } 
{1^}{八丑}，它的1^ 2 =0. 76, df = 1。 

表 4. 2表 4. 1拆分数据形成的年龄、地域和教育三维交互表的拟合模型 


拟合边际 L 2 d.f. 


{AR}{E} 

61.00 3 

• 0. 00 

{AR}{RE} 

51.71 2 

0. 00 

f 

{AR}{AE} 

10.58 2 

0. 01 

{AR}<RE}{AE} 

0.76 1 

0. 38 


最后，分析顺序的第三阶段将公民自由态度作为因变量，在确定解释完整 
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四维表观测频数的最佳 logit 模型的过程中拟合了三维边际 { ARE }。 表 4 . 3 
显示了一系列可能模型的结果。我们再一次看到，在公民自由态度项上的全 
部 3 个二变量效应都是有必要的，但是添加三维交互项并不能显著地提高已 

经由 {ARE} {RS}{ AS} {ES} 提供的极佳的拟合优度。这一模型的 L 2 = 2. 92, 
df = 4 0 

现在我们将以上分析结果汇总，能够最好地呈现表 4. 1中数据的递归因果 
模型是连续的二维、三维和四维交互表模型的总和。这个模型拟合了边际表格 
{A}{R}{AR}{RE}{AE}{RS}{AS}{ES}, V = (0. 03 + 0. 76 + 2. 92) = 3. 71, 

df = (1 + 1 + 4) = 6。对因果效应进行估计的参数是先前描述的 logit 模型中的 
系数。这些都以最终因果模型图的形式在图 4. 2中显示出来。因为整个系统 
是由二分变量组成的，因此，每个局部关系的单个^都可以被解释为自变量对因 
变量发生比(对数形式）的影响。因此，我们可以看到，年纪大的人一般教育水 
平较低，而那些居住在南部以外的人有更多的机会接受大学教育。持有宽容的 
公民自由态度的发生比随着接受大学教育和居住在南部以外的地区而提高，但 
在年纪较大的人中较低。不像量化变量系统中的路径系数，我们不能合理地通 
过教育使年龄或地区与态度联系起来的路径相乘的办法来估计间接因果效应 
的大小。但通过注意这些复合路径的符号，我们可以看到，两个事先被决定变 
量的间接作用的方向与直接因果路径发生作用的方向一致。我们也可以通过 
比较直接效应^的大小(因为两个都是优比的标准形式)来判断原因变量的相对 
重要性。教育比其他两个变量对公民自由态度有更大的直接影响。 



公民 

自由 

观念 


图 4. 2最终因果模型 



翔表数据分析 


表 4. 3拟合表 4. 1年龄、地域、教育和公民自由观念四维交互表模型 


拟合边际 

L 2 

d. f. 

P 

{AREHS} 

200. 48 

7 

0. 00 

{ARE}{RS} 

149. 57 

6 

0. 00 

{ARE} {AS} 

138. 48 

6 

0. 00 

{ARE}{ES} 

87.75 

6 

0. 00 

{ARE}{RS}{AS} 

84. 72 

5 

0. 00 

{ARE}{RS}{ES} 

44. 74 

5 

0. 00 

{ARE} {ASHES} 

48. 69 

5 

0. 00 

{ARE} {RS}{ ASHES} 

2. 92 

4 

>0. 50 


我们对这些变量因果关系的考察表明，没有交互项具有显著性。如果这样 
的边际表被用来拟合数据，它们在因果模型图中呈现的形式会是如下两种中的 
一种: （1) 代表两个(或更多)相交互的原因变量符号将被放入一个圆圈中，一个 
箭头从圆圈指向交互作用影响的因 变量； （2) 交互作用可以通过从一个自变量 
上引岀一个箭头线，指向连接其他自变量与因变量符号的箭头线中点的方式来 
描述。如果需要表示许多交互作用，那么使用第一种常规的方法不会使图表看 
上去那么杂乱。虽然我们强调二分变量的因果分析，但这在理论上并不妨碍将 
其延伸到多类别变量的分析中。然而，如果有3个或更多的类别，就会产生3个 
或更多的系数，它们在图表中的呈现会变得很烦琐。这时再将其类比于具有 
标准回归系数的路径分析就不行了，这或许解释了为什么实际上这种方法只限 
定于分析二分变量模型。 


分析随时间的变化性 


随着社会科学的逐渐成熟，个人层次上的时间序列数据的可得性增加了。 
运用对数线性方法来研究个人社会行为改变的能力还没有充分发挥出来，但是 
一些基本技术已经建立了。在这一节中，我们将讨论对两种形式的调查数据的 
应用：（1)比较截面研究。在此研究中，两次或更多次的重复调查被实施，但不 
需要针对同一群应答者。 （2) 追踪调查。在这一调查中，同一个个体会在两个 
或更多时间点上被询问同样的调查项。关于量化测量分析方法的许多研究都 
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可被归纳入离散变量的例子中。 


比较截面 

当一套相同的调查问题被在两个时点上实施的调查所测量时，一个根本性 
的问题是••“这些变量是否随着时间的推移在相同的程度上发生 共变? ，，运用量 
化测量 ，我们 通过察看相关性大小、回归或方差一协方差矩阵，或者运用由尤里 
斯克格 ( Jdreskog ，1970) 发展的方法来尝试性地回答这个问题。当涉及类别测 
量时，回答这个问题的努力就以比较来自不同调查的发生比或优比的形式和用 
一个单一对数线性模型来拟合所有数据集合频数的形式表现出来。比较截面 
分析的独特特征就是明确地引入一个时间变量 (T)。 在某种程度上，如果 T 与 
其中一个实质性变量相关，那么，这个变量的边际分布就随时间的改变而改变； 

在某种程度上，如果 T 与两个或更多的实质性变量相互作用，这些变量间的相 
关性大小就会显著地改变。 

我们对比较截面分析的演示使用了综合社会调查中1972年和1976年总统 
选举时，党派认同与为党派候选人投票间关系的数据。虽然有时候投票被当成 
主观性党派认同的结果，但在这一问题上，我们把它们视为结果变量。我们主 
要的兴趣是这对变量在两个时点上共变关系的大小。表 4. 4显示了政党 (P)、 
总统选举投票(V)和时间 (T) 的交互表。表中的分布反映了 1972年众所周知的 
民主党对尼克松 (Nixon) 的背叛，1976年又恢复为各党派支持者压倒性地投票 
给自己党派的候选人和无党派人士的票数大约各占一半这一更典型的模式。 


时间 


1972 

1972 

1972 

1976 

1976 

1976 


表 4. 4 

党派认同、总统选举选择和时间交互表 

党派认同 

观察值(期望值)总统选举选择 

民主党 

共和党 

民主党 

290(295. 27) 

136(130. 73) 

中立 

98(92. 15) 

198(203. 85) 

共和党 

13(13. 57) 

250(249. 43) 

民主党 

380(374. 73) 

67(72. 27) 

中立 

123(128. 85) 

130(124. 15) 

共和党 

29(28. 43) 

227(227. 57) 



荈表歡撮分析 


关于两次选举中政党一投票的相关性是否不同这一问题，可以通过设定一 
个不考虑三变量交互作用的非饱和模型，并将结果与完全拟合数据的饱和模型 
进行比较的方式来检验。模型 { TP }{ TV }{ PV } 的 L 2 = 1. 88, di = 2 0 因此，拟 
合优度最佳的对数线性模型不需要包含交互效应 TPV ， 这表明， PV 的关系随着 
时间推移并没有显著变化，这与表 4. 4的表面现象正好相反。表 4. 4给出了 
{ TP } { TV } { PV } 模型的期望频数。 TP 和 TV 两个双变量关系都有实质性的解 
释。它们表明，投票选择和党派认同的边际分布(在其他变量的类别内）在两次 
测量时间之间发生了变化。 


两期追踪调查 

当应答者在以后的时间点就相同的问题被再次访问时，这样的调查就是两 
期追踪调查。在这一节中，我们的讨论将限定在对两个观测时期之间变量所发 
生变化的分析，虽然我们认识到 ，一 些最有趣的假设是关于两个变量之间的联 
合变化。关于后一个议题，建议读者参考古德曼 （ Goodman ， 1973、 1979) 和邓 
肯 ( Duncan ，1980) 的文章。我们的分析将集中讨论所谓的“正方形表格”(表中 
的行和列变量的类别数量相同，如 K X K 表），它不仅是追踪数据的典型特征，同 
时也是诸如职业流动和配对应答比较这些实际问题所特有的。 

当对相同变量的第一次和第二次测量被制成正方形的 KXK 交互表时 ，一 
个明显要进行的统计检验就是独立性检验。然而，这个检验事实上是缺乏实际 
意义的，因为我们通常期望大多数人都停留在初始状态(类别的），特别是当观 
察的间隔时间非常短时。因此，了解到在两个时间点上的测量之间有相关性并 
不能告诉我们很多关于发生改变的性质。有3种模型可以用来拟合数据并对随 
时间发生的变化模式进行更深入的洞察。这些是我们将要讨论的内容。这些 
模型可以用来检验边际同质性假设、对称性假设和准对称性假设，简写为 H mh 、 
H s 和 H qs 。 我们赋予这些假设明确的意义并展现检验这些模型的 L 2 值如何从 
各种对数线性模型设定中直接或间接地获得。 

边际同质性最容易说明。如果一个正方形表格相应行和列的边际分布是 
相等的，即如果 fi . = f . i ， 那么它就具有边际同质性。但遗憾的是，我们不能为这 
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个模型所对应表格的内部单元格的期望值写一个简单的对数线性模型。相反， 
我们必须以一种迂回的方式来实现边际同质性，即利用3个假设 Hmh 、 H s 和 

Hgs 中已经有一个已知关系的事实。在明确这一关系之前，让我们首先来说明 
对称性和准对称性假设。 

只有当类别间的变化模式完全平衡时，才存在对称性。对一个正方形表格 
而言，如果^ ^并且 i 关 j (对所有非对角线单元格而言），那么表格就具有对 

称性模式。沿着对角线“对折”表格，在对应的单元格上将显示完全相同的频 
数。比如，在流动研究中对父亲的职业和儿子的职业做交互表，如果是对称表， 
不仅说明相等数量的向上和向下流动，也说明相同模式的向上和向下流动。值 
得注意的是，对称表一定显示边际同质性，因为行与列如果有相同的单元格项， 
就必定有相同的总和。但是，具有边际同质性并不表示同时具有对称性，因为 
相同的总和可以通过许多不同的方式来实现。 

对单元格期望频数的最大似然估计 Fij ，在正方形表格的对称性假设下很容 
易通过对两个适当的观测频数取平均值的方法而得到： 


= Fji = + fji )/2 (i ^ j ) [4. 1] 

因为对角线上的单元格在假设中没有涉及，所以自由度就等于对角线单元格数 
目的一半(对角线上方的单元格项并不独立于对角线下方的单元格项，对角线 
单元格被忽略 了）： df = k(k — 1)/2。似然比卡方检验统计量的形 式为： 

U = 2 ^ fy Ln(fjj/Fy ) [4.2] 

这一公式表示的只是非对角线单元格的总和。 

以对数线性模型作为对称性假设的替代性(但相同的)表示法的过程 如下： 
首先，将对角线上的单元格排除出考虑范围。把剩下的单元格分为两组，一组 
为对角线上方的三角矩阵，一组为对角线下方的三角矩阵。沿着上方三角矩阵 
的边“翻转”，使它变为下方的三角矩阵，并使之与原来下方矩阵对应的行和列 
的单元格项相吻合。把这两个矩阵放在一起，我们就可以从最初的二维交互表 
得到一个三维的数组排列。对此，我们以 I 代表第一（行）测量值， J 代表第二 



(列)测量值， M 代表分区的两部分。接下来，将三维表带入对数线性分析，在这 
一分析中，每个分割区右上方的缺失项用“结构零值”来表示。也就是说，有待 
拟合的模型将把0置于这些单元格中作为期望值(在实际编辑一个算法程序的 
过程中，结构零值将被一个“起始值”表所设定，在此表中显示0的单元格项将不 
断地强制迭代算法，使0在这些单元格中持续呈现出来）。 

最后，为了产生展现对称性的单元格期望频数，用于拟合这个三维数据的 
边际为 { U }。 要注意的是，任何涉及 M 的项都没有出现，第三个变量是通过将 
原始的 KX K 表格拆分为两个三角形而生成的。像前面一样，通过比较观测频 
数和期望频数得到的 L 2 值，应该与 K ( K - l ) 的自由度相对比而得到评估。 

为了说明对对称性的检验，我们考察调查研究中心关于美国1956年至 
I 960 年选举追踪调查的研究数据。我们特意查看了在两次选举中都报告了政 
党认同的202个天主教投票者。以前对这些数据的分析表明，在天主教投票者 
中有一个从共和党向民主党的明显转移，这大概是由于约翰 • 肯尼迪 （John 
Kennedy ) 作为候选人参选 ( Knoke ， 1976)。表 4. 5的上半部分明显显示出两个 
边际中的这一变化，无党派人士和共和党类别中的数量在1956年至1960年间 
下降了。当对称模型被用来拟合6个内部非对角线的单元格时，所得的期望频 
数在表 4. 5下半部分显示出来。对于这一假设， L 2 = 20. 99, df =3。 这意味着， 
我们必须拒绝在各个方向上的转移会相互抵消的假设。 

继续分析这个例子，首先，我们检验发生的变化是否主要是在一个方向上 
(移向民主党或移向共和党）。我们使用类麦克尼曼 （ McNemar ，1962:52) 检验 
统 计值： 


X 2 = (b — c) 2 /(b + c ) 2 [4.3] 

b 是对角线一边观测频数的总和， c 是另一边的总和。因为 X 2 = 15.7, df = 1, 
所以我们的结论是，净变化主要朝着一个方向发生显著趋势，对表格的检视表 
明是朝着民主党的方向。 

接下来提出的问题是，对称性修改后的形式是否仍然存在于表格中？即除 
了表 4. 5 中对角线上部案例数比下部更少这一事实以外，对角线上下的案例分 
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布模式是否相同。如果对角线上部单元格间的优比等于下部的优比，尽管绝对 
的单元格频数不等，但分布模式仍然被认为是相同的。这个被修改的对称性假 
设使边际能拟合有结构零值的三维数据，因此维持了每个三角形的总 
频数(在真正的对称性中，情况并非如此），但允许边际分布的自由改变。表 4 . 6 
给出了观测频数和为三维呈现而被修改的对称性假设下的期望频数。这个模 
型的 L 2 =4. 36, df =2, 所以，为了拟合 M 而包括进来的额外参数(如允许发生 
的改变主要在一个方向上)显著地提高了拟合优度，使 L 2 值降低了 16. 63 。 这 
个模型支持了这样的假设 :虽然 向每个党派转移的大小不同，但转移模式是相 
同的。也就是说，虽然改变的方向是不同的，但结果取决于改变的对称性。 



正方形表格中的准对称性意味着，在边际分布非同质性的限制约束下尽可 
能地实现表格中的对称性条件。虽然对对称性检验的实际应用很浅显易懂，但 
准对称性检验却并非如此。当然，此检验的主要用处是能够（间接地)对边际同 
质性进行捡验。之所以可以用这个检验是因为，对称性模型与准对称性模型之 
间的唯一区别在于，前者包含了边际同质性的假设而后者却没有。这些模型对 
数据“拟合优度”的差别完全是边际同质性假设的函数。因此，准对称性检验与 
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对称性检验之间的差别就是对边际同质性的检验。我们已经明白如何对对称 
性进行检验了，现在，我们转向对准对称性的检验。 

表 4. 6表 4. 5数据的三维呈现 

转向民主党(对角线以下） 转向共和党(对角线以上） 

1956年党派认同 i960 年党派认同 1960年党派认同 

民主党 中立 合计 共和党 中立 合计 


观察频数 


中立 

共和党/民主党 
合计 

19 

11 

30 

9 

9 

19 

20 

39 

6 

1 

7 

4 

4 

6 

5 

11 

修正对称模型下的期望频数 

中立 

17. 94 

— 

17. 94 

5. 06 

— 

5. 06 

共和党/民主党 

9.36 

11. 70 

21.06 

2. 64 

3. 30 

5. 94 

合计 

27.30 

11.70 

39. 00 

7.70 

3. 30 

11.00 


为确定一个准对称性的对数线性模型，我们沿着主对角线“翻转”整个 K X 
K 表，录入这个翻转表格和原始表格，使其成为一个完整的三维度数组排列。那 
么，使用先前的表示法，以 I 代表第一(行)测量值 ， J 代表第二(列)测量值 ， MR 
表分区的两部分，获得拟合扩展数据的边际 { IJ }{ IM }{ JM }。 因此，这个程序除 
了使用的是完整表格而不是两个三角形之外，与对称性检验非常相似。拟合扩 
展数据的模型也与对称性模型相似，只是增加了允许行与列的总和可以不同的 
条件(通过纳人 { IM } 和 { JM } 项）。 

因为第一张表是第二张表的复制，所以两个表中的期望频数也将相互复 
制，但顺序颠倒了。作为结果， L 2 值和自由度都必须被一分为二以获得正确的 
值来用于检验。表 4. 7显示了准对称性假设的期望频数，表明已获得了一个极 
佳的拟合优度， L 2 = 0.12, df = ( K—IKK —2)/2 = 1。因此，我们的结论是， 

在给定两年的边际不相等的条件下，这个追踪调查数据具有对称性。我们现在 
到了检验边际同质性假设的时刻。为对称和准对称模型创建期望频数的同时， 
我们通过减法程序能够得到边际同质性假设的 L 2 值。在对称与准对称模型间 
的 L 2 值差异为 20. 87, df 差异为2。因此，认为天主教投票者的党派认同的边 
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100. 00 

3. 73 

1. 28 

105 

19. 28 

30. 00 

5. 72 

55 

10. 72 

9. 28 

22. 00 

42 

130 

43 

29 

202 


将边际同质性、对称性和准对称一般化到三维数据中是可能的 （Bishop et 
al. ， 19 7 5:299—309 )。其 中一个更有趣的实际应用来自豪斯 （ Hauser) 等人 
(1975a 、 1974b) 的研究，此研究表明，美国的代际职业流动在实质上是保持不变 
的，虽然在应答者和他们父亲的职业分布之间有边际改变。他们的方法是用三 
维对数线性模型来拟合两个或更多的职业流动交互表，在这张表中，父亲一儿 
子 的职业相关性 {PS} 被假设为不随时间的改变而改变 (即 = l ⑻）。 5 个大 
型的关于美国人的研究数据证实了这一假设。在对数线性模型应用于流动研 
究的越来越多的文献中包含了豪斯 (Hauser ， 1978) 、 古德曼 (Goodman ， 1979d) 
和邓肯 (Duncan ， I 979 ) 最近的文章。 

马尔科夫链模型 

一 个可应用于三期或多期类别追踪数据的特殊假设是一阶马尔科夫过程 
检验或马尔科夫链分析。虽然我们仅涵盖了在马尔科夫链中的时间稳定性假 
设以作为对前一节两期追踪数据向三期或多期情况的自然扩展，然 而读 者可能 
发现这部 分内容 很密集，并且 没有马尔科夫链的基础知识 (Markus ， 1979)。当 
多期追踪数据被排列成正方形的列联表时，起始状态(在时间 t 时的应答)在行 
中，结束状态(在时间 t + 1时的应答)在列中。转移矩阵(包含了在时间 t 时，处 

于任何给定状态中的人在时间 t + 1 时将处于某种特定状态的概率)可以通过产 
生各行内的比例值来估计 ，即： 


际分布在 1956 年和 1960 年间存在显著差异是合理的。 

表 4. 7在准对称模型下的期望频数 


1956年党派认同 


I960 年党派认同 


民主党 


中立 


共和党 


合计 


党党 
主立价计 
民中共合 



运用从 3 个时间点上收集的数据，能产生两组转移 概率: 从时间1到时间2的转移 
概率和从时间2到时间3的转移概率。我们关于数据的第一个问题是，这两组转 
移概率是否相等？也就是说，它们没有随时间的改变而改变(时间稳定性假设)。 
如果这个假设有数据支持，那就可以继续研究在经过很长一段时间之后，变量各 
类别观测值的最终分布将是怎样的。这个问题只有将常数转移矩阵提高到连续 
更高次方才能回答。因为长期的边际分布独立于一阶稳定同质马尔科夫过程中 
的初始向量，所以我们认为，不同状态间的人口流动是非历 史的: 一个人随着时间 
推移，在不同状态间流动的概率只取决于转移矩阵(是恒定不变的），并且这个人的 
状态在转移之前就已经立即被设定。它并不取决于更前期的条件。 

为了检验马尔科夫链中转移概率的时间稳定性，我们需要对每个个体最少进 
行3次观测，而且最好是在相等间距的时间间隔上。两个交互表被生成并被堆叠 
地放进一个单一的三维表中。在这些矩阵中，行内是稍前观测阶段的状态，列内 
是稍后观测阶段的状态，还有与转移时期相对应的堆叠层次，单元格内是观测频 
数。对应于转移概率时间稳定性假设(结束状态是起始状态的函数而不是时间的 
函数)的对数线性模 型为： 


T7 F S T FS FT r A 

^ijk = rjc , z ] r k ry r ik L 4. 4」 

换句话说，如果稳定性假设正确，那么，模型 { FS } { FT } 应该为数据提供一个可 
接受的拟合优度。模型中的 { FT } 项与对每行的转移概率相加为 1.000( 它使起 
始状态间的案例分布与模型无关）的要求具有相同的功能。但是，给定起始状 
态 F 、 结束状态 S 不取决于转移时间 T ， 因此，#项没有被纳入模型中。 

有研究者报告了在1958年所做的一个研究数据，这个研究收集了男性研究 
对象在以前的20年里经历的地理流动的回溯性报告。表 4. 8显示了来自这个 
研究的两个转移矩阵。很明显，在每一个涵盖7年间隔的时期中，大多数人都待 
在他们原来的地区，虽然在第二次世界大战中有巨大的迁移。但是在第一个矩 
阵中主对角线上的观测值更小，这暗示了人们的地理流动过程在整个时期中并 
不是保持不变的。当公式 4. 4中的模型被用来拟合与表 4. 8相对应的频数交互 
表时， L 2 = 116. 45, df = 12。这个对模型的显著偏离说明，随着时间的推移，在 
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转移概率上存在某些不稳定性。当然，当涉及26000多个案例时，要找到任何一 
个除饱和模型之外令人可以接受的拟合优度是很难的事情。如果评估大样本 
拟合优度的、看似合理的“基准模型”是一组一维边际 { F } { S } { T }， 其 L 2 = 
60174, df = 24,那么稳定性假设就是正确的，能解释两个矩阵中超过99%的方 

差。出于这个原因，我们倾向于后一种结论。关于类别数据马尔科夫链进一步 
深入的议题可参见毕夏普等人 (1975 : 257—279) 的文章。 


表 4. 8男性地理迁移的两个一阶转移矩阵 


起始地区 


目的地区 


合计 (Ni.) 

东北 

-1卜 邹 由都 

南部 

西部 


1^4 一 1951 年 

东 

北 

0. 9645 

0. 0087 

0. 0122 

0. 0145 

1. 000(3437) 

北部- 

-中部 

0. 0048 

0. 9575 

0. 0120 

0. 0257 

1. 000(4160) 

南 

部 

0.0114 

0. 0255 

0. 9494 

0. 0136 

1.000(4110) 

西 

部 

0. 0082 

0. 0291 

0.0157 

0. 9475 

1.000(1341) 

1951— 1958年 

东 

北 

0. 9803 

0. 0047 

0. 0091 

0. 0059 

1. 000(3393) 

北部- 

-中部 

0. 0022 

0. 9750 

0. 0082 

0. 0147 

1.000(4157) 

南 

部 

0. 0057 

0. 0134 

0. 9701 

0. 0107 

1. 000(4015) 

西 

部 

0. 0013 

0. 0088 

0. 0067 

0. 9831 

1.000(1483) 


资料来源: Spllerman ， 1972。 


年龄、时期和同期群模型 

在社会变迁的研究中，重复截面研究经常被用于对出生在大约相同历史时 
期的同期人群的态度和行为模式的研究。是否属于同期群中的成员是由进行 
调查时应答者的年龄决定的。因此，任何因变量中3个可能的方差来源（年龄、 
时期和同期群)之间并不是相互独立的。 

同期群=时期一年龄 [4.5] 

任何试图使用全部“人口学”特征变量作为自变量来分析因变量的尝试都将导 
致一个不能被识别的模型，它的效应参数不能被单独地估计出来 (Mason et al . ， 
1973)。以年龄、时期和同期群进行类比的数据形成的类别交互表会产生识别 
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问题，就如量化变量一样 (Fienberg & Mason , 1979) 0 

对3个人口学变量之间线性相关的认识增进了克服识别问题局限性的工 
作。所有这些工作都是从假设模型具有可加性开始的，比如，所有的年龄效应 
在不同的时期和同期群间是不变的，所有的同期群效应在不同的年龄组和时期 
之间是不变的，所有的时期效应在不同的年龄组和同期群之间是不变的。然 
而，即使拥有这个假设，识别问题仍然存在。最近，费恩伯格和梅森提出了一个 
关于因变量与年龄、时期和同期群变量间可加关系的 logit 模型，它可以解决识 
别和估计的技术性问题。因为对他们提出的解决方案的技术性展示将非常复 
杂，所以在这里不能完整地呈现，但是对这种方法简短和非技术性的勾画表明 
了对数线性方法千变万化的本质，从而能够把握社会变迁的根本性问题。 

表 4. 9给出了关于某些年龄一时期一同期群数据的一个可能展现 ( Smith ， 
1979)，表中强调的是年龄和时期方面的影响。相同对角线上的单元格条目处 
于相同同期群中。要注意的是，年轻的 （8 — 11) 和年长的 （1 一 4) 同期群在某些 
时期有缺失值，因为其成员在研究所涵盖的时期内或许没有达到15岁或者已经 
超过了 49岁（涵盖的年龄段）。 

表 4. 9每10万人中犯杀人罪频数的年龄一时代一同期群交互表 


时 代 

年龄组 1952— 1957— 1962— 1968— 1972—同期群 

1956年 1961 年 1967年 1971 年 1976年 
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为了估计像表 4 . 9这样表格的期望频数，从而能够得到3个人口学变量(年 
龄、时期和同期群)的参数，就必须加上一个识别说明（除了前面讨论的模型中 
的可加性假设）。也就是说，必须在一个或更多参数上加一个限定约束条件以 
减少必须获得的独立估计值的数量。含限制性条件的例子，诸如处于某一个年 
龄类别的效应是某个特定的常数 （rf = c)， 或者处于一个同期群中的效应等于 
处于第二个同期群中的效应 （if = 4)。像这样一个单一的限制性条件就足够达 
到可识别性，因此模型中的所有参数都能被估计岀来。对数线性模型 {APC} 
{AD}{PD}{CD} —— A 为年龄， P 为时期， C 为同期群， D 为因变量——能够通 

过迭代比例拟合算法来估计所需的单元格期望频数。下面是这一过程的简要 
描述。 

我们从对表 4 . 9的数据建立新的排列组合开始。需要明确的是，我们已经 
添加了隐含的另一半数 据:每 10万人中没有犯杀人罪的频数。虽然我们认识 
到，每个单元格包含10万个案例的假设是不现实的，但这个假设并不影响作为 
最终研究对象的犯杀人罪的发生比。这个新的排列组合被称为“展 开表” ，它包 
含了年龄 X 时期 X 犯杀人罪这样一个四维度的排列组合。因为空间有限，我们 
在表 4. 10中只呈现了完整表格的一部分，但已经能够看到一般格式。每一个子 
表就是由年龄和时期代表的一个单一同 期群; 子表中所有剩下的单元格都是结 
构零值。对于这些数据，我们添加了一个识别说明，即40岁至44岁的年龄效应 
等于45岁至49岁的年龄效应。这在展幵表中通过将这两个年龄组合并的方式 
来呈现(例如，将代表40岁至 M 岁的行与代表45岁至49岁的行相加）。 

下一步是估计表 4. 10中展现的展开表的单元格期望频数，运用对数线性模 

型 {APC}{AH}{PH}{CH} - A 为年龄， P 为时期， C 为同期群， H 为因变量， 

即犯杀人罪。模型对数据拟合的失败是一个指标，表明存在年龄、时期和同期 
群的非相加效应，例如，年龄效应随着时期或同期群的不同而变化。 

表 9 中数据的期望频数通过模型 { APC } { AH } { PH } { CH } 被估计出来， 
并在表 4 . 11中被呈现。表 4. 12为这一模型和其他与之相比较的模型提供了 
拟合优度数据(基于原始表格每个单元格有10万个案例的简化假设）。相对而 
_，年龄、时期和同期群效应的相加模型(模型 8) 比模型 1( 无年龄、时期或同期 
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群效应)减少了大于9 9 %的 L 2 值，这表明，小于1%的方差是年龄、时期和同期 
群的非相加效应的结果。同样清楚的是，年龄、时期和同期群各自的效应有广 
泛的重叠。例如，整个同期群效应自身减少了 63%的 L 2 值，独立于年龄和时期 
的同期群效应却只占6%。 


表 4. 11表 4. 9的年龄一时 代一同 期群数据的期望频数(在模型 { APC }{ AH }{ PH }{ CH } 下) 


年龄组 


时 代 


1952— 
1956年 


1957— 
1961 年 


1962— 
1966年 


1967— 
1971 年 


1972— 
1976年 



表 4. 12拟合年龄、时代、同期群和杀人罪四维交互表的模型 


模型 


拟合边际 


V 


d . f . 


1 

2 

3 

4 

5 

6 

7 

8 


{APC}{H} 

{APC}{AH} 

{APC}{PH} 

{APC}{CH} 

{APC}{AH}{PH} 

{APC}{AH}{CH} 

{APC}{PH}{CH} 

{APC}{AH}{PH}{CH} 


69. 12 
29. 42 
44. 16 
25. 74 
4. 46 
3. 12 
20. 95 
0. 30 


29 

24 

25 
20 
20 

15 

16 
12 


为了研究可相加的年龄、时期和同期群效应的性质，可通过如下方法来计 
算效应参数 :使用 将杀人罪的期望频数(表 4. 11) 除以不犯杀人罪的期望频数而 
计算出来的犯杀人罪的期望发生比。这个过程并不直接明了，为了理解它，我 
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们首先将单元格中的发生比 （ n ) 表示为生成期望频数的效应参数的函数。比 
如，考虑年龄组 6(40 —44岁）、时期 1(1952—1956 年），它们是同期群2的一部 
分，其期望发生比在公式 4. 6中被 给出： 


^612 


T- APC AH PH CH A P C H 

-^6121 _ ^612 ^*61 In Z~2i Z\ Ti T\ 
P — APC AH PH CH A P C H 
^ 6122 ^612 ^62 ^12 r 22 ^6 ^2 ^"l 


[4. 6] 


因为所有与杀人罪 ( H ) 无关的 r 参数在分子与分母上是相同的，所以可以被删 
除。那些与犯杀人罪有关的分子上的 r 参数是那些分母上的 r 参数的倒数，因 
此，整个发生比公式缩减为4个乘积项，这些乘积项与犯杀人罪的年龄效应、时 
期效应、同期群效应有关，同时与犯杀人罪的边际分布也 有关： 


n 612 = (OWOW [4.7] 


如果我们现在要为年龄组 7、 时期 2、 同期群 2 创建相同的发生比，我们就会得到 
a 22 = ( rf ) 2 ( r 『 r ) 2 ( r 『) 2 ( rr ) 2 。 最后，建立这两个发生比的比率(即单元格6、1、 
2 的期望发生比与单元格 7、2、2 的期望发生比的比率)，我们得到如下 公式： 


ai 2 _ (r 6 f ) 2 (rfr) 2 (0 2 ( r r) 2 
a 22 (r^) 2 (r 2 T) 2 (r^ H ) 2 (rr) 2 


[4. 8] 


公式 4. 8 分子上的两项与分母上的两项是相同的，可以消去。由于识别限制为 
年龄组6的效应，等于年龄组7的效应，这个比率可以进一步简化为时期1的效 
应与时期2的效应比率的平方。其他期望发生比的比率为时期2的效应相对于 
时期3的效应，时期3的效应相对于时期4的效应等产生类似的比率。最后，因 
为对于所有时期效应乘积的限制条件必须具有统一性，因此，我们能计算岀每 
个效应参数的大小。以类似的方法，使用从表 4. 11中得出的期望发生比的比率 
和先前计算的时期效应，现在我们就能计算出年龄和同期群的效应参数。因为 
表格中有许多单元格可以用来计算诸如年龄组4相对于年龄组5的比率，所以 
人们就可能想知道，到底应该使用哪个单元格。答案其实是，它们中的任何一 
个都可以，因为它们产生的结果是相同的 (Feinberg & Mason , 1979:14—15)。 

表 4. 13给出了关于年龄、时期、同期群的可加模型的效应参数。简言之，我 
们能够看到时期效应随时间的推移而降低，这与表 4. 9中的第一印象正好相反。 
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同期群 


0. 547 
0. 612 
0. 677 
0. 771 
0. 888 
1.019 
1. 163 
1. 300 
1.501 
1. 690 
1.651 


年 龄 


表 4. 13模型 {APCHAH}{PH}{CH} 的 

时 代 


AH 

TU 

0. 701 

PH 

Tu 

i. 

232 

AH 

1. 028 

PH 

Tzi 

i. 

073 

AH 

r 3 i 

1. 105 

PH 

^31 

o. 

945 

AH 

^41 

1. 109 

PH 

『41 

0. 

964 

AH 

r 51 

1.094 

PH 

0. 

831 

ah 61 

1. 034 




AH 

^71 

1. 034 





年龄效应开始时较小，在30岁至34岁这个年龄组类别中达到顶峰，然后又减 

小。另一方面，同期群效应开始时非常小，然后在后继的同期群中就一直单调 
递增，直到最后。 


純 


r^CH r CH r c„ r CH r CH r CH r c„ r CHr91CHl 5 一 





第 5 章 I 对数线性模型的特殊技术 


有时，关于社会资讯数据的交互表会产生奇怪的表格，如果这些表格不经 
过特别的调整，就不适合用对数线性分析。在本章中，我们着重考虑一些可能 
产生的更一般性的问题。 


处理零单元格 

如果在一个或多个单元格中都岀现0,可能就存在一个问题，因为如果发 
生比、优比和 logit 的分母为0,就无法被定义。在两种情况下，观测频数会出 
现零值。抽样零值出现在有限样本中，特别是当有许多变量建立交互表时， 
一些类别的可能性太小(例如，南方的犹太花生农）。零值并不意味着这样的 
案例在总体中并不存在，而是因为案例没能进人样本。对数线性模型的一个 
优点就在于，虽然样本中的经验实例不存在，但这些模型可以为总体频数提 
供经验估计。尽管观测频数^为0,但拟合模型仍能够生成非零的期望频数 
巧。不过，如果一个表中有“太多”的抽样零值，仍然可能产生问题，即被模型 
拟合的边际表会包含零值的单元格。在这种情况下，有两个基本替代方案可 
供选择：（1)在表中每个单元格中加一个很小的值，包括那些非零频数的单元 
格。经常被建议加的值为 0.5( Goodman ， 1970: 229) ，这是一个保守做法，会 
低估效应参数和它们的显著性。 （2) 武断地定义0除以0等于 OCFienberg , 
1977:109)。在第二个替代性方案中，如果有待模型拟合的边际表中的任何 
一个单元格记录为0,那么，所有导致这个0的其他单元格记录在迭代过程中 
都必须保持为0。有一个不太可行但可能的第三种替代方案就是，增加足够 
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多的样本量来消除所有的零值单元格。第二种产生零值的情况是在逻辑的或 
设定的零值单元格中产生观测零值。即使全部的总体都可获得，但某些类别 
就是没有经验的指涉对象。逻辑零值可能产生于抽样设计 (遗漏 特定层 次）、 
事件顺序序列（比如，在一个年龄和家庭地位的交互表中，年龄在25岁以下的 

祖父的单元格将是空的）或者是明显的概念矛盾（比如，女性不可能做前列腺 
切除手术）。 

对数线性模型解决逻辑零值的办法是将这些单元格界定为“结构零值， ，(例 

如，问题结构的结果），并且不去估计这些单元格的期望频数。在前面关于两期 

追踪调查的部分，我们看到如何通过将结构零值单元格设定为迭代程序的起始 

值以运用对数线性模型来拟合不完全表格。相同的过程在检验具有一个或更 

多结构零值表格的准独立性假设时被遵循。准独立性是考虑只有部分表格含 

有非零单元格时，变量间独立性和无相关性的一种形式。例如，在一个二维表 

中，准独立性模型在一组没有被指定为逻辑零值的单元格中拟合对数线性 
公式： 


F ij = Vcfz \ [5. 1] 

似然比卡方值通过与修正过的自由度相比较而被检验。如果表格有 I 行、 J 列 
和 Z 个结构零值单元格，则它的自由度为 （I 一 1) (J 一 1) 一 Z 。 

表 5. 1用性别与外科手术的交互表数据来说明准独立性模型。某些种类的 
手术在逻辑上对某一性别的人而言是不可能发生的。表中的第二个追踪显示 
了在这些逻辑零值被忽略时独立模型的期望频数，而第三个追踪显示了当逻辑 
单元格被限定为零固定值时的期望频数。 


标准的独立性模型将空单元格当做抽样零值，估计女性的前列腺手术数和 
男性的妇科手术数这些不合常理的数值。我们发现拟合优度 很差： l 2 = 
622.52, df = 13 0 当准独立模型被拟合时，不仅两个逻辑零值单元格被限制，而 
且剩余单元格的期望值更近似于观测值，虽然这个模型仍然不能够充分地代表 

数据 （ L 2 = 93 . 5 7 , df = 11)。很明显，撇开逻辑上不可能的过程不谈，手术操作 
也是根据性别有区别地实施的。 
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表 5.1 性别和外科手术交互表(万人) 


Ul rc： lx 


观察值 

独立 H 0 

准独立 H 0 

外科手术 - 

男性 

女性 

男性 

女性 

男性 

女性 

神经外科 

18 

20 

16.2 

21.8 

19.9 

18. 1 

眼科 

33 

44 

32. 7 

44.3 

40.3 

36.7 

耳鼻喉科 

175 

89 

112.3 

151.8 

138.3 

125.7 

心血管 

59 

38 

41.2 

55.8 

50.8 

46.2 

胸腔 

16 

12 

11. 9 

16. 1 

14.7 

13.3 

腹部 

139 

142 

119. 5 

161. 5 

147.2 

133.8 

泌尿科 

86 

45 

55. 7 

75. 3 

68. 6 

62.4 

前列腺切除术 

27 

— 

11.5 

15.5 

27.0 

— 

乳房 

2 

36 

16.2 

21.8 

19.9 

18. 1 

妇科 

— 

383 

162.9 

220. 2 

— 

383.0 

整形外科 

135 

129 

112.3 

151.8 

138.3 

125.7 

整形 

55 

53 

45.9 

62. 1 

56.6 

51.4 

口腔一牙科 

26 

30 

23.8 

32. 2 

29.3 

26.7 

活组织切片检查 

39 

74 

48. 1 

65.0 

59.2 

53.8 

合计 

810 

1095 

810 

1095 

810 

1095 


资料来源: Ranofsky， 1978。 


设定起始值 

在不完全表格中处理结构零值频数的程序涉及在合适的单元格中将迭代 
比例拟和算法的起始值设定为0。在其他情况下，我们可能希望将某些单元格 
限定在观测频数上，然后估计在剩余单元格上的各种对数线性模型。此外，这 
些模型需要在开始迭代拟合之前，将 ECTA 起始表中的某些值设定为先验值。 
一个恰当的例子是对于代际职业流动的分析，比如，表 5. 2显示的布劳 ( Blau ) 和 
邓肯 (1967) 经典研究中所获得的数据。从第二个追踪可以清楚地看到，关于行 
与列之间独立性的一般模型并不能很好地拟合数据。5个主要对角线单元格大 
体上都被低估了，这反映出有很多人仍然停留在开始时的职业大类上(这个模 
型的 L 2 = 830.98, df = 16)。 
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表 5. 2美国白人男性代际职业流动(万人) 


父亲的职业 



儿子的职业 


专业人员 
和管理 
人员 

办事员和 
销售员 

手工 

业者 

操作员 

和体力 

劳动者 

农民 

观测频数 

专业人员和管理人员 

152 

65 

33 

39 

4 

办事员和销售员 

201 

159 

72 

80 

8 

手工业者 

138 

125 

184 

172 

7 

操作员和体力劳动者 

143 

161 

209 

378 

17 

农民 

98 

146 

207 

371 

226 

期望频数、标准独立模型 

专业人员和管理人员 

63.4 

56. 9 

61.0 

90.0 

22 . 7 

办事员和销售员 

112. 1 

100. 6 

108.0 

159. 3 

40. 1 

手工业者 

134. 9 

121. 1 

130.0 

191. 7 

48.3 

操作员和体力劳动者 

195. 7 

175. 7 

188. 5 

278. 1 

70. 1 

农民 

225. 9 

202. 8 

217.6 

320. 9 

80. 9 

期望频数、准完全流动模型 

专业人员和管理人员 

152 

38. 1 

41. 9 

58. 7 

3. 3 

办事员和销售员 

99. 9 

159 

105. 4 

147. 5 

8.2 

手工业者 

125.7 

120.4 

184 

185. 5 

10.4 

操作员和体力劳动者 

171.3 

164. 1 

180. 6 

378 

14. 1 

农民 

183. 1 

175.4 

193. 1 

270. 3 

226 

期望频数、修正的准完全模型 

专业人员和管理人员 

152 

66.0 

33.8 

39. 6 

2. 6 

办事员和销售员 

201.0 

159 

71.2 

83.3 

5.4 

手工业者 

122. 9 

140. 1 

184 

168.0 

11.0 

操作员和体力劳动者 

124. 7 

142. 1 

246.3 

378 

17.0 

农民 

131. 5 

149.8 

259. 7 

371.0 

226 


资料来源 ： Blau Duncan , 1967:496。 


由古德曼 ( Goodman ，1965) 首先 提出的 一个替 代模型是准完全流动模型。 
在这个 模型中 ，主 对角线上的单元格被设定为它们的观测值，而对角线以外的 
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单元格就如同在准独立性模型中那样被估计。在程序上，主对角线值被记录并 
被当做结构零值;边际表格 { PHS } 被 拟合； 因为主对角线值已经被设定，所以自 
由度减少5。然后，主对角线值又被重新置于表格中。准完全流动模型如在表 
5.2 的第三个追踪中所显示的那样，显著地提高了拟合优度。现在的 L 2 值为 
255. 14,以仅仅5个自由度的代价减少了 575. 84。 

可以通过把非对角线上的20个单元格分为两组，每组10个的方式来进一 
步实现拟合优度的提高，对应于男子相对于其父亲职业的向上和向下流动。每 
一个三角形子表都可以通过前面章节用过的方法对其准独立性进行检验。例 
如，在检验向下流动的半张表中，我们假设沿着主对角线和表中较低三角形部 
分的单元格都为结构零值。期望频数在表 5. 2的第四个追踪中显示岀来。向上 
流动子集产生的 L 2 = 28. 97, df = 3,而向下流动子集的 L 2 = 3. 63, df = 3,合 
计后的 L 2 = 32. 60, df = 6。这表明，虽然模型与数据仍然有显著的差异，但相 
对于开始时的标准独立模型而言，已经有了一个明显的改善，即使有很大的样 
本量也是如此 (3396 万）。 


分析定序数据 

到目前为止，我们考虑的所有模型对变量类别的次序都不做假设。针对拟 
合优度的 L 2 验证对变量类别具有的次序不敏感，在行与列进行置换时，它仍然 
保持不变。如果研究者对检验表中的一个变量在事实上是否有次序性特征感 
兴趣，对数线性模型就可以被调整以提供这样的检验。西蒙 ( Simon ，1974) 给出 
了迭代程序如何估计列内变量类别被赋予分值（比如，1、2、3、4代表变量的4 
个类别）的一个二维表的单元格期望频数。费恩伯格 （ Fienberg ， 1975： 52—58) 
也讨论了这个程序，并讨论了它如何被一般化到3个或更多维度且包括二次或 
更高次的元素以及多于一个变量具有次序特征的表格中。 

在我们的演示说明中，我们沿用了邓肯 ( Duncan ，1979) 描述的一种技术，这 
种技术将三维表中的三分因变量分级。表 5. 3给出了 1972年综合社会调查关 
于年龄、宗教和教会参与交互表的观测频数以及设定好的模型 { AR } { AC } { RC } 
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( L 2 = 7. 25, df = 2) 的发生比和优比。如果在表 5. 3 底部的关于期望优比的 
3 X 4 表被用来作为拟合模型 {AR} {C} 的一组起始值，那么，它将准确地再产生 
出由模型 {AR} {AC} {RC} 得岀的期望频数。然而，其在自由度上不会有所增 
加，因为我们必须从与第一个模型相关联的6个自由度中减去4个，用于计算期 
望优比(虽然显示了 6个优比，但有2个是多余的）。将期望优比作为设定模型 
{AR}{C} 的起始值将再产生出由模型 {AR}{AC}{RC} 得岀的期望频数的原因 
在于，迭代比例拟合算法不会改变起始值中已经给定的优比，除非那些起始值 
涉及有待拟合的边际。通过对纳入了分析 (AC) 和 (RC) 关系所需优比的起始值 
的使用，然后通过拟合不会改变内置 (AC) 和 (RC) 关系的模型 {AR}{C}， 我们最 
终得到了与 {AR}{AC}{CR} 等价的模型。 


表 5. 3年龄、宗教和教会参与交互表 


宗 教 

年龄 


教会参与 


发生比 

低 

中等 

高 

中等：低 

高 ： 低 

观测频数 

非天主教徒 

年轻 

322 

124 

141 

0. 39 

0. 44 

非天主教徒 

年老 

250 

152 

194 

0. 61 

0. 78 

天主教徒 

年轻 

88 

45 

106 

0. 51 

1. 20 

天主教徒 

年老 

28 

24 

119 

0. 86 

4. 25 

期望频数 

非天主教徒 

年轻 

329. 05 

127. 90 

130. 05 

0. 39 

0. 40 

非天主教徒 

年老 

242. 95 

148. 10 

204. 95 

0.61 

0. 84 

天主教徒 

年轻 

80. 95 

41. 10 

116. 95 

0.51 

1. 44 

天主教徒 

年老 

35.05 

27. 90 

108. 05 

0. 80 

3. 08 




期望优比 


观测优比 

非天主教徒 

年轻 

1 

1 

1 

1 1 

1 

非天主教徒 

年老 

1 

1. 56 

2. 10 

1 1. 56 

1. 77 

天主教徒 

年轻 

1 

1. 31 

3. 60 

1 1.31 

2.73 

天主教徒 

年老 

1 

2. 05 

7. 70 

1 2. 21 

9. 66 
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然而，我们可以通过另一种方式来使用这个程序。这些关系并不是要试图 
再提供上面所提到的常规的、不受限定的 (ACKRC) 关系，它们被限定为一种特 
殊的形式(线性、二次、对数尺度中的线性等），这种限定是通过对反映这种特殊 
形式的发生比起始值的适当选择而实现的。 

比如，假设我们以如下的形式设计一组起始值而不是4个独立的 优比： 

1 1 1 

1 c c 2 
1 y y 2 
1 cy c 2 y 2 

现在，其中只有两个参数要被估计，并且中等程度：低程度和高程度：低程度 
的教会出席与年龄和宗教的发生比将被限定为对数等级尺度中的线性形式。 
获得 c 和 y 的数值是一个将不同的值代入起始表直到一对 c 和 y 的 L 2 达到最 
小值的冗长和繁琐的试错过程 (Duncan， 19 7 9,显示了对于一个二维表而言，西 
蒙的技术如何能被用于确定研究开始时的 c 和 y 值的上下限)。 

对于表 4. 11中的数据，我们发现，如下优比的起始值产生了最低的 L 2 = 
14. 62， df = 4： 


1 

1 

1 

1 

1. 47 

2. 16 

1 

1. 94 

3. 76 

1 

2. 85 

8. 13 


其中， c = 1. 47, y = 1. 94。这些线性限定性模型中的期望优比能够与表 5. 3中 
的观测值相比较。 一 个明显的一贯性高估存在于除了两个案例之外的所有案 
例中。图 5. 1给出了关于线性限定性模型的观测优比和拟合优比之间差异的 
一种思路。这些比率是基于在教会参与各个类别中的自变量计算出来的。由 
起始值拟合的线性限定性要求两条线是平行的。邓肯 （1979) 说明了如何放 
宽这个要求，使线性条件能够得到保持的同时又允许两条线相交（例如，不同 
的斜率）。 
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教会参与 教会参与 

图 5.1 观察与期望对数比率 


合并多类别变量 

交互表的分析者经常在分析前拆并多类别变量的类别 ，以 简化解释或避 
免上面提到的抽样零值的问题。然而在大多数情况下，这样的拆并是基于一 
个特定的基础的，将相互接近的类别或者只有很少边际频数的类别合并到一 
起。邓肯 ( Duncan ，1975) 提岀了一种检验交互表中多类别变量可拆并性的方 
法，我们用表 5. 4 的三维数据将它演示出来。如果一个妇女太贫穷而无力抚 
养更多的孩子，那么，她是否应该被允许进行合法堕胎？我们将对这一问题 
的支持或反对的态度作为因变量。支持和反对的应答发生比在 4 个宗教团体 
中的某些团体之间有显著的差异，尽管在 6 年时间里，应答发生比几乎没有什 
么变化。用各种不同的三维 logit 模型来拟合数据证实了这一直观的感觉，拟 
合边际 { RY }{ RA } 能充分地代表数据 ( L 2 -1. 89, df = 4)。与 此相反，堕胎态度 
不依赖于任何自变量的 logit 模型 { RY }{ A }， 拟合数据 非常差 （ L 2 = 130. 16 , 


df = 6 )o 
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表 5. 4按宗教和时间划分的堕胎态度交互表 



1972年的态度 

1978年的态度 

支持的发生比 


支持 

反对 

支持 

反对 

1972年 

1978年 

新教 

460 

498 

424 

501 

0. 92 

0. 85 

天主教 

147 

240 

151 

225 

0. 61 

0.67 

犹太教 

41 

10 

23 

6 

4. 10 

3. 83 

其他 

65 

17 

88 

30 

3. 82 

2. 93 


我们接下来要问的问题是，四类别的宗教变量能否被拆并成 3 个或更少的 
类别，以产生一个能够为数据提供一个简约解释的、介于上面两个模型之间的 
模型。为了建立检验，宗教变量被 4 个二类别变量替代——新教 （ P )、 天主教 
( C )、 犹太教 ( J ) 和其他(0)。效应编码显示在表 5.5 中。因此，这个程序与回归 
分析中对虚拟变量的使用相类似。对于那些非逻辑的二类别变量的组合(如应 


表 5. 5表 5. 4拆并宗教的效应编码和期望频数 

二分宗教变量 1972年的态度 1978年的态度 

新教天主教犹太教其他 支持 RM 
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答者拥有多于一个的宗教类别），就在起始表中设定为结构零值。与上面提到 
的两个 logit 模型相对应的模型分别为 { YPCJO }{ A } 和 { YPCJO }{ PCJOA }。 但 
现在，我们能够对各种中介模型进行检验，在这些模型中，一些宗教变量而不是 
其他变量被允许影响对堕胎的态度。分析的结果显示在表 5. 6中。每一个中介 
模型(表中的2— 11) 都显示了拆并宗教变量各种类别的结果。例如，模型 
{ YPCJO }{ CA } 只有天主教徒或非天主教徒对堕胎态度的影响。其他的宗教类 
别都被隐含地合并到一起，没有独立的影响。在最佳拟合模型11中，天主教徒 
或非天主教徒以及新教徒或非新教徒都有单独的影响。犹太教的各个类别和 
其他宗教都没有单独的影响，并被隐含地合并或拆分。最终的结果是一个宗教 
三分法。在这个模型下的期望频数也显示在表 5. 5中。两个年份里回答支持的 
发生比是相 同的: 新教为 0. 89,天主教为 0. 64,犹太教和其他宗教为 3. 44。 


表 5. 6表 5. 5宗教拆分性的对数线性模型 


模型 

拟合边际 

L 2 

d. f. 

P 

1 

{YPCJOHA} 

130. 16 

6 

0. 00 

2 

<YPCJO}{PA} 

128. 57 

5 

0. 00 

3 

{YPCJOHCA} 

98. 21 

5 

0. 00 

4 

{YPCJ0HJA} 

94. 03 

5 

0. 00 

5 

{YPCJOHOA} 

56. 49 

5 

0. 00 

6 

{YPCJO}{PA}{JA} 

94. 03 

4 

0. 00 

7 

{YPCJO}{JA}{CA} 

68. 04 

4 

0. 00 

8 

{YPCJOHOA} {PA} 

52. 72 

4 

0. 00 

9 

{YPCJ0}{0A}{CA} 

37. 47 

4 

0. 00 

10 

{YPCJO}{OA}{JA} 

15. 65 

4 

0. 00 

11 

{YPCJOHCA} {PA} 

2. 30 

4 

>0. 50 

12 

{YPCJOHPCJOA} 

1. 89 

3 

>0.50 


非分层模型 

我们已经多次表明，我们将限定于只考虑分层模型，并且我们相信，这个限 
定在大多数应用中都是有意义的，其中的原因我们将在下文中指出。事实就 
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是，当古德曼第一次开始呈现他在对数线性模型上的研究时，就包含了这个限 
定于分层模型的限制，很多人对此的反应是感觉限制太大，他们想研究非分层 
模型(可能只是因为他们相信他们无法研究）。实际上，限定于分层模型并不是 
对数线性模型的特征，而是对数线性模型中用于估计期望频数的迭代比例拟合 
算法的特征。其他算法——例如，被纳入博克和亚特斯 （ Yates ) 的程序 MUL - 
TIQUAL 或哈勃曼的程序 FREQ 中的牛顿一拉夫逊算法——就没有这样的 
限定。 


为什么限定于分层模型在大多数应用中是有意义的？为了寻求答案，让我 
们再次思考一下，当我们第一次介绍分层模型概念时讨论过的四变量交 互表: 
投票参与( V )、教育 ( E )、 种族 ( R ) 和自愿性社团成员身份 ( M )。 让我们暂时忽 
略教育，考虑模型 { VMR } 。 如果这个模型拟合了数据，它将表明，成员身份对投 
票参与的影响随着种族而变化。完整的分层模型 将是： 

17 — V M R VM VR MR VMR 

r ijk — TjTi Tj T k Tij r ik r jk r ijk 

现在，让我们考虑一下对这个模型的非分层替代模型，如下 所示： 

T7 一 V M R VM MR VMR 

— rjti r k ry r jk r ijk 

在这个非分层的替代性模型中，我们省去了投票 X 种族这一项。事实上， 
这个模型并没有遗漏这一项，而是假设这个效应不存在(即 r 的参数值为 1. 00)。 
因为一个涉及所有项的交互效应被呈现在了模型中，然而还因为我们对此效应 
先前的解释表明了，成员身份一投票参与之间的关系随种族而变化并不是唯一 
的解释，所以我们要仔细考察我们的非分层模型说明了什么。首先，思考这个 
三维效应的另一种有效的解释••种族和投票参与之间的关系随着自愿性社团成 
员身份而变化。在我们的非分层模型中，我们假设在种族和投票参与之间没有 
关系，如果情况的确如此，并且存在显著的三维效应，那么结果就一定是，那些 
没有成员身份的人中的种族一投票关系与那些有一个或更多自愿性团体成员 
身份的人中的种族一投票关系在大小上相等，但在方向上正好相反，将这两个 
局部关系相加，正好可以相互抵消。这是不是一个合理的事先假设？在大多数 
情况下，答案显然是否定的。正是出于这个原因，非分层模型在大部分情况下 
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L 2 

d . f . 


1.88 


2. 09 


0. 39 


0. 55 



是没有意义的。 

然而在某些情况下，非分层模型又是有意义的，为了说明，我们简要地考察 
一个非分层模型。针对这个例子，我们重新思考在说明比较截面分析时的数 
据。之前，我们考察党派 ( P ) 和总统选举投票( V )的关系是否随着时间推移 ( T ， 
在1972年至1976年间)而变化，我们的结论是没有变化，因为模型 { TP } { TV } 
{ PV } 很好地拟合了数据。这个分层模型可以完整地 写为： 

I- — TPVTPTVPV 
’ ijk T|Z*i Tj ^"ij ^jk 

因为这个分析利用了两个(几乎)相同规模的截面样本，所以我们可以做一个先 
验的假设，认为 r T 的值是一致的，即没有影响。结合这个假设，估计下面的非层 
次 模型： 

17 — P V TP TV PV 

r ijk = r/Tj T k Tij r ik r jk 

表 5. 7 给出了这一分析结果与前面的分析结果的比较。可以看出，效应参 
数和 L 2 值的变化不大。自由度增加了 1，因为被估计的参数减少了一个。 

表 5.7 模型 { TP }{ TV }{ PV} 的分层与非分层版本的 Tati 参数 


T rl PC p r2 v rl TPrllTP r12 TVrll pv rll pv r21 


第 6 章 I 结论 





本书对运用于列联表分析的对数线性模型的介绍，只是对其潜在的适应性 
和应用性进行了一些浮光掠影地描述。这些方法在社会科学中的地位正逐年 
得到巩固。 

对交互表进行系统定量分析的两个竞争性技术已经脱颖而出，我们有必要 
在结论部分做一个简短的评述。戴维斯 ( Davis ，1975) 提岀了线性流程图系统 
和相应的公式 ( d 系统）。 d 系统分析与一般最小二乘法回归密切相关，它被明 
确设计为用于类别变量小系统的因果建模。前因变量对因变量的效应是依据 
比例上的变化(因此， d 表示差异）而不是发生比上的变化被显现岀来的。戴维 
斯认为，他的方法以并行的方式处理交互作用，且在通过中介变量描述因果透 
射时，比对数线性模型更具优势。 

第二种技术在政治科学家中获得的流行度比在社会学家中的大，这就是葛' 
瑞泽 ( Grizzle ) 等人提出的最小 logit 卡方法。在这种方法中，有待解释的因变量 
是一个特定应答(结果）的概率。主效应和交互作用是通过对一个设计矩阵的 
操作处理而在模型中被设定的，这个设计矩阵是由根据效应进行编码的虚拟变 
量所组成的。这个过程使研究者能够建构和估计非层次模型。虽然这个 OSK 
方法与对数线性模型相比，其优势在于，大多数使用者在对类别变量的概率解 
释上有更大的熟悉度，但在处理零值(空)单元格时看似存在更多问题。 

对数据分析技术的选择最终应该基于对研究问题的实质性构想，而不是基 
于主观认为单一的方法可以用于所有可能的情况。如果本书现有的说明解释 
能够帮助读者更好地掌握某种特定的方法，我们的目标就达到了。 



对数线性模型 


参考文献 


Asher, H. B. (1976) Causal Modeling. Beverly Hills, CA ： Sage. 

Bishop ， Y. M. , and S. E. FIENBERG(1969) “Incomplete two-dimensional contingency tables. ’’ 
Biometrika 22 ： 119 — 128. 

- and P. W. Holland ( 1975) Discrete Multivariate Analysis : Theory and Practice. Cambridge : 

MIT Press. 

Bock, R. D. ， and G. Yates(1973) “MULTIQUAL，log linear analysis of nominal and ordinal quali¬ 
tative data by the method of maximum likelihood ： A FORTRAN program* ’’ Chicago : National 
Educational Resources. 

Blau, P. M. , and O. D. Duncan ( 1967 ) The American Occupational Structure. New York ： 
John Wiley. 

Davis, J. A. (1976) “Analysis contingency tables with linear flow graphs ： D systems，’’ in D. R 
Heise(eA ) , Sociological Methodology 1976. San Francisco ： Jossey-Bass. 

- (1974) “Hierarchical models for significance tests in multivariate contingency tables ： an exege¬ 
sis of Goodman’s recent papers，” in H. L. Costner(ed )， Sociological Methodology 1973 —— 
1974. San Francisco ： Jossey-Bass. 

Duncan, O. D. (1980) “Testing key hypotheses in panel analysis ，’’ in K. F. Schuessler(ed. ) , Socio¬ 
logical Methodology 1981 . San Francisco ： Jossey-Bass. 

- (1979) “How destination depends on origin in the occupational mobility table. ” American 

Journal of Sociology 84 :793 — 803. 

- (1975a) Introduction to Structural Equation Models. New York ： Academic Press. 

- (1975b) “Partitioning polytomous variables in multiway contingency analysis. ” Social Science 

Research 4 ： 167 — 182. 

- (1996) “Path analysis : sociological examples. ’’ American Journal of Sociology 72 : 1 — 16. 

- and J . A. McRae, Jr. (1978) “Multiway contingency analysis with a scaled response or factor，’’ 

in K. F. Schuessler(ed. ) , Sociological Methodology 1980. San Francisco ： Jossey-Bass. 

Fienberg, S. E. (1977). The Analysis of Cross-Classified Data. Cambridge : MIT Press. 

- and W. M. Mason(1978) “Identification and estimation of age-period-cohort models in the anal¬ 
ysis of discrete archival data，” in K. F. Schuessler(ed ) > Sociological Methodology 1980. San 
Francisco ： Jossey-Bass. 

Goodman, L. A. (1979a) “A brief guide to the causal analysis of data from surveys. ” American 
Journal of Sociology 84 : 1078 — 1095. 

- (1979b) “Multiplicative models for square contingency tables with ordered categories. ” Bio- 

metrica 66 ： 413 — 418. 

- (1979c) “Simple model for the analysis of association in cross-classifications having ordered cat¬ 
egories. w Journal of the American Statistical Association 74 ： 537 — 552. 

- (1979d) “Multiplicative models for the analysis of occupational mobility tables and other kinds 

of cross-classification tables. ” American Journal of Sociology 84 ： 804 — 819. 




72 


列表数据分析 


-(1973a) The analysis of multidimensional contingency tables when some variables are posteri¬ 
or ^ others ： a modified path analysis approach . ，， Biometrika 60 ： 178 — 192. 

(1972a) “A modified multiple regression approach to the analysis of dichotomous variables . ，， 
American Sociological Review 37 ： 28 — 46. 

— (1972b) “A general model for the analysis of surveys. ’’ American Journal of Sociology 77- 
1035—1086. * 

(1970) “The multivariate analysis of qualitative data ： interactions among multiple classifica- 
tions. ’’ Journal of the American Statistical Association 65 ： 226 — 256. 

(1965) “On the statistical analysis of mobility tables •” American Journal of Sociology 70: 
564—585. * 

Grizzle, J. E. , C. F. Starmer, and G. G. Koch(1969) “Analysis of categorical data by linear mod¬ 
els. w Biometrics 25 : 489 — 504. 

Haberman, S. J. (1979) Analysis of Qualitative Data{Yol 2). New York ： Academic Press. 

—(1978) Analysis of Qualitative Data( Vol. 1). New York ： Academic Press. 

Hauser, R M. (1978) “A structural model of the mobility table. ” Social Forces 56 ： 919—953. 

J. N. Koffel, H. P. Travis, and P. J. Dickinson( 1975a) “Temporal change in occupational mobil- 
ity: Evidence for men in the United States. ” American Sociological Review 40 ： 585—598. 

Joreskog, K. G. (1970) “A general method for analysis of covariance structures. ” Biometrika 57 : 
239—251. * 

Konke, D. (1976) Change and Continuity in American Politics : The Social Bases of Politics. Bal¬ 
timore ： Johns Hopkins University Press. 

and R Thomson(1977) “Voluntary association membership trends and the family life cycle. ” 
Social Forces 56 : 48 — 65. 

Kritzer, H. M. (1978) “An introduction to multivariate contingency table analysis.” American 
Journal of Political Science 22 \\K1 — 226. 

Markus, G. B. (1979) Analyzing Panel Data. Beverly Hills, CA ： Sage. 

Mason, K. O. , W. M. Mason, H. H. Winsborough, and W. K. Pooie(1973) “Some methodological 
issues in cohort analysis of archival data* ” American Sociological Review 38 : 242 — 258. 
McNemar, Q. (1962) Psychological Statistics. New York ： John Wiley. 

Olsen, M (1972) “Social participation and voting turnout ： a multivariate analysis. ” American Soci¬ 
ological Review 37 ： 317 — 333. 

Ranofsky, A. L. (1978) Utilization of Short-Stay Hospitals : Annual Summary of the United 

State ， DM (Vital and Health Statistics Series 13 No. 37). Hyattsville, MD ： National Center 
for Health Statistics. 

Reynolds, H. T. (1977) Analysis of Nominal Data. Beverly Hills, CA ： Sage. 

Simon, G. (1974) “Alternative analyses for the singly-order contingency table. ” Journal of the 
American Statistical Association 69 •• 971 — 976. 

Smith, M. D. (1979) “Increases in youth violence ： age, period or cohort effect •” Presented at the 
meetings of the American Sociology Association * Boston. 

Spilerman, S. (1972) “The analysis of mobility processes by the introduction of independent variable 



对数线性模型 


to a Markov chain. M American Sociology Review 37:277 — 294. 

Stephan ， F. ， and P. McCarthy(1958) Sampling Opinion. New York ： John Wiley. 

Thomson ， R ， and D. Knoke(1980) “Voluntary associations and voting turnout of American ethno¬ 
religious group. ’’ Ethnicity ( forthcoming). 

Verba, S. , and N. H. Nie(1972) Participation in America : Political Democracy and Social Equal¬ 
ity. New York ： Harper Row. 



列表数据分析 



fitted marginals 
fitted-marginal notation 
independence hypothesis 
inverse relationship 

Iterative Proportional Fitting Algorithm 

log-linear model 

marginal category 

marginal odds 

marginal row totals 

Markov chain models 

maximum likelihood estimate(MLE) 

McNemar-like test statistic 

minimum logit chi-square method 

multiple R 2 

Newton-Raphson algorithm 
nonhierarchicai models 
nonsaturated model 
odds 

odds ratio 
odds table 
ordered data 
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categoric panel data 
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categoric variable 
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chi-square test for independence 
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comparative cross-section study 
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first-order stationary homogeneous Markov process 
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拟合边际 
拟合边际表达法 
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对数线性模型 
边际类别 
边际发生比 
边际行总数 
马尔科夫链模型 
最大似然估计 
类麦克尼曼检验统计值 
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递归因果模型 
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结构零值 
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“起始值”表 
一般对数线性模型 
转移矩阵 
转移概率 
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迈克尔 • 豪特撰写的《流动表 分析》 一书全面回顾了分析职业出身与职业获得的交 
互分类数据时使用最广泛的方法。但是，这不应该使读者认为本书只对社会学家有用， 
或者只对那些使用这些方法的社会学家有用。正如豪特教授在本书开头部分所指出的 
以及在本书行将结束时所论述的那样,流动表分析的模型和方法可以被应用于相当广泛 
的研究领域。流动表的显著特征在于行分类与列分类的一致性①。既然这一特征在现 
实社会中如此常见，那么，豪特对流动表分析方法的回顾和解析就应该能够应用于许多 
不同的背景和 学科。 

第1章介绍了流动表分析的基本概念和检验方法，以说明是否存在完全流动(事实 
情况是，这种情形很少发生)。第2章考察了部分流动的几种特定情形，也就是说，流动 
在最高或最低类别中是有限的。这些模型是更为一般化的模型的特例，而如何发展这一 
模型则在第3章中做了交待。需要指出的是，第2章所介绍的模型都假定行/列分类确 
实存在高低排序，但并非所有的流动表分析都要求这种假定。第4章提到的模型更为一 
般化，所涉及的流动性和稳定性情形更加复杂。第5章的关注点稍有变化，更接近于社 
会经济地位的获得分析。其方法和假设都与流动研究有所不同，豪特在本章一开始就对 
此作出了清楚的说明。第6章对最近的文献进行了讨论，向读者呈现出流动表分析将来 
的发展方向。最后，第7章通过几个实例展示了如何将流动表分析方法应用于其他研究 
领域。 

作者在整本书中都留意并指出了各种模型之间的异同。为了实现这一目的，书中的 
模型都被应用于父亲职业与儿子第一份职业之间的同一个流动表数据，该数据来自费瑟 
曼 (Featherman) 和豪斯在1973年有关美国劳动力代际流动的研究。考虑到许多读者可 
能会尝试去重复书中的.分析以更好地理解这些模型，本书在给出模型结果时保留了足够 
的细节，以便有兴趣的读者可以实现他们的这一想法。尽管本书并没有就如何运用计算 


①而不在于分类本身。 —— 译者注 


机软件程序来估计这些模型给出详细指导,但还是就运算过程中的疑难之处提供了相关 
的建议。 

鉴于本书所介绍的方法在流动研究乃至该领域之外具有广泛的应用性，并且全书的 
介绍全面、清晰，《流动表分析》一书对广大学生和从事研究工作的读者来说将会有很大 
的 帮助。 


理查德 • G . 尼米 (Rlchand G . Niemi ) 


第 1 章 I 流动表分析 




社会流动是社会科学的主要研究对象之一。对代际流动的研究兴趣可以 
一直追溯至马克思 ( Marx ) 和韦伯 （ Weber ) ，但相比社会学的其他分支，该研究 
领域的分析技术却发展得更快，新发现和新成果也更多。这在一定程度上是由 
流动分析在增进我们对于社会分层的理解方面的地位所决定的。由于代际流 
动的结构性特征反映了资源占有的优劣势对比在上下两代人之间的持续，因而 
对于机会、阶级和特权等基本问题的回答都依赖于对这一流动结构的正确刻画。 
要领会这一点，可以尝试比较一下李普塞特和本迪克斯 (Lipset & Bendix , 1959： 
57— 60)、伦斯基 ( Lenski ， 1966: 411—415) 、布劳和邓肯 (Blau & Duncan , 1967： 
43 2— 4 41)、赖特和佩罗内 （Wright & Perrone , 1977)、费瑟曼和豪斯 （1978: 
481—495)、布里格 ( Brieger ，1981) 以及豪特等人关于资本主义社会机会结构的 
不同结论。 

在过去的10多年里，方法论上的许多发展促进了社会流动研究的进步。其 
中的某些发展是相当技术化的。在本书中，虽然我努力将技术层面的细节保持 
在最低限度，但读者至少要对列联表数据分析技术的最新发展有必要的认识， 
这样才能理解后面将要介绍的一些流动模型。在这方面，费恩伯格 （ Fienberg ， 
1980)、诺克和伯克(1980)、克洛格 ( Clogg ) 的著述无疑是很好的人门读物。另一 
方面，读者不必掌握潜在结构模型、准统一关联模型或其他类似模型的最新进 
展。当涉及这些模型时，它们会被作为新的参考资料在本书中予以介绍。 

流动表分析的发展迅速扩展至其他研究领域，并见证了路径分析的日渐流 
行。本书所介绍的这些模型可以应用于任意一个对称表。一些并非社会流动 
分析的应用举例会在第7章中给出。 




基本概念 


流动表依据人们在两个时点上所从事的职业将他们进行划分。较早的时 
间点通常被称为“职业出身”，较晚的时间点则被称为“职业获得”。职业的高低 
次序排列通常依据的是社会经济地位，但这种排列反映的是社会流动模式的某 
种特征，而非流动表本身的特征。最常见的职业岀身变量是受访者在成长时 
期，其父亲所从事的职业，另一个常见的职业岀身变量是受访者的第一份职业。 
最常见的职业获得变量则是受访者当前所从事的职业(或简称“现职”），而受访 
者的第一份职业也可以被当做职业获得变量，正如本书中许多研究实例所显示 
的那样。从父代职业向子代第一份职业或现职的社会流动是代际流动，而从 
(子代)第一份职业向现职的社会流动则是代内流动。 

在选择了职业出身变量和职业获得变量之后，就必须定义各种职业类别， 
并将其进行编码。这是一项繁重的数据精简工作，因为原始的职业编码与流动 
表的职业编码相比要精细、具体得多 （Hodge， 1981)。在美国劳工部的《职业名 
称词典》 o/ Occupational Titles ) 中，就编撰了超过 12000种职业。 

如此庞杂的职业分类体系在数量上必须被精简至可以用来研究的几个大类。 
许多大型研究项目都把最初的职业数据信息按照美国人口普查所使用的441种 
分类体系重新进行编码 (Featherman et al. ， 1977) ，但即使如此，对流动表分析 
来说，这一数字还是太大了。 

在选择一个合适的职业分类数目方面，标准并不是很明确。许多研究者都 
是从理论和实际两方面的考虑来做决定。如果研究目的是识别阶级之间的界 
限，正如社会流动模式所揭示的那样，那么，职业分类就不应该将不同阶级的人 
们混在一起。例如，研究者必须慎重决定到底将“工头”划归为哪一个职业类 
别。在人口普查的职业分类体系中，“工匠”这一类别包括了“工头”和“技术工 
人”这两种具体职业。虽然“工头”与“白领工人”相比，更多的是从事体力工作， 
并且在社会经济地位上更接近于大多数的“工匠”，但就管理与被管理的关系而 
言，他们显然处于不同的阶级位置。 
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另外一项需要考虑的工作就是对已有研究的职业编码规则进行比较。如 
果辨别发展趋势或重复以往的研究结果构成了一个重要的目标，这种比较研究 

就显得尤其重要。在这种情况下，编码时最主要的考虑就应该是尽量与其他研 
究保持一致 ( Baron ， 1980)。 

本书的大部分例子都会将职业划分为5大类别。另外一些研究会使用17种分 
类法。关于5种分类法和17种分类法之间的对应关系，参见图 1. 1。但是，在英国社 
会流动分析中所使用的职业分类与此不太相同，因而也很难将其整合起来，这个例 
子反映岀职业分类编码这项起步工作是何等重要 (Goldthrope & Hope , 1972)。 


上层非体力职业 

专业人士（自雇） 

专业人士 (受雇） 

经理人员 

销售人员(非零售业) 

下层非体力职业 

小业主 
文职人员 

销售人员(零售业） 

上层体力职业 

技术工人(制造业） 

技术工人(其他行业) 


技术工人(建筑业） 

下层体力职业 

服务业人员 
操作工人(其他行业) 
操作工人(制造业） 

搬运工人(制造仆） 

搬运工人(其他行业） 

农民 

农场主或农场经营者 
农业耕作者 


图 1.1 职业的5种分类法与17种分类法 

一旦职业类别划分好，对数据的处理分析就可以开始了。在大多数研究 
中，同时也在贯穿本书的所有实例中，对职业出身和职业获得会采取同样的分 
类方法，而且排列次序也是相同的。流动表中的每一个单元格都对应一种职业 
岀身和一种职业获得的组合，其数字就是具备这种组合的人数。如果用丨表示 
行，用 j 表示列，那么 fu 就表示职业岀身是 i 并且职业获得是 j 的人数①。当 i 和 j 


①换言之，就是流动表中第 i 行、第 j 列的频数。——译者注 
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湃表数据分析 


相同时，这部分人的职业岀身和职业获得就相同(前提是所使用的职业分类标准 
能够区分职业出身和职业获得)，这些 i = j 的单元格就构成了流动表的主对角线。 
这些单元格有特别的含义，因为它们代表的是不流动的一群人。对本书后面要介 
绍的许多社会流动模型而言，区分“流动的”和“不流动的”个体十分重要。 

有时候，流动表也会出现某种不同的形式。与报告职业出身和职业获得不 
同，一些研究者会将受访者划分为向上流动、不流动、向下流动几个类别，然后 
将根据这种划分所构建的“流动状态”变量与职业出身、职业获得或一些其他变 
量进行交互分析。但这种操作方法不值得提倡，因为流动状态经常掩盖了数据 
中所存在的重要关系，它在简单合并职业出身和职业获得两方面信息的同时， 
忽略了这两个变量之间的相关性 （ Duncan , 1966； Boudon , 1975)。例如，采用 
上述这种分析路径的大多数研究都报告说，社会流动与教育和父代职业无关。 
构建流动状态这一变量的做法实际上仅仅采用了流动这一单方面的信息来报 
告数据，从而规避了职业岀身和职业获得的对应和组合模式这一更为重要的研 
究问题。使用流动状态这种处理方式的问题就在于，它简单粗暴地置原始数据 
所存在的规律性于不顾。 

表 1. 1给出了一个流动表的例子。该表根据父亲的职业类别和儿子的 
第一份职业类别（仅限全职性的平民工作），将1973年美国男性中20岁至 
64岁的就业人口进行了划分。本书中所举的例子，大部分都使用的是这个 
流动表。 


表 1. 1父亲的职业与儿子的第一份职业的交互分类 


父亲的职业 

上层非体力 

儿子的第一份职业 
下层非体力上层体力下层体力 

农民 

合计 

上层非体力 

1414 

521 

302 

643 

40 

2920 

下层非体力 

724 

524 

254 

703 

48 

2253 

上层体力 

798 

648 

856 

1676 

108 

4086 

下层体力 

756 

914 

771 

3325 

237 

6003 

农民 

409 

357 

441 

1611 

1832 

4650 

合计 

4101 

2964 

2624 

7958 

2265 

19912 


资料来源 ： Featherman 8^ Hauser, 1978:49 。 
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流动表数据的来源 

大多数流动表数据都来自对劳动人口的调查。美国人口普查局于1962年 
和1973年收集了社会流动的数据，作为对3月“人口现状调查”数据的补充。两 
次数据收集的工作分别是在彼得 • M . 布劳 （Peter M . Blau ) 和奥迪斯 • 邓肯 
(Otis Duncan ) 、戴维 • L . 费瑟曼 （David L . Featherman ) 和罗伯特 • 級豪斯 
(Robert M . Hauser ) 的指导下进行的。10年一次的人口普查数据并没有提供 
代际流动的信息，但却能用于代内流动的分析，因为自1970年以来，人口普查便 
开始在样本人群中同时收集他们当前的职业和前一个职业的信息。 

流动表数据的另一个来源是美国一些州的行政数据库中的婚姻记录。在 
这方面，罗格夫 ( Rogoff ，1953) 利用印第安纳波利斯市的婚姻登记数据所做的 
代际流动分析便是一项具有开拓性的工作。 

由于学者们所做的社会流动研究实在太多，在此恕难 一一 列出。值得注意 
的两项早期研究分别是格拉斯 (Glass ， 1954) 在英国以及李普塞特和本迪克斯 
(Lipset & Bendix, 1952) 在美国奥克兰进行的，其时间恰好都是在 1949 年。当 
代大规模收集社会流动数据的努力之一是美国综合社会调查 （ N 0 RC ， 1980 )， 
该项目定期调查代际流动方面的信息。 


初步分析 


有一套适用于任何列联表的基本方法可以被用来对流动表进行初步分析。 
其中，最基础的分析方法就是计算行内或列内的百分比分布。表 1. 2报告的就 
是表 1. 1的行内百分比和列内百分比的计算结果。我们通常将行内百分比称为 
“流岀”百分比，将列内百分比称为“流入”百分比。这两个百分比共同反映了代 
际之间的劳动力流动情况。流岀百分比记录的是职业出身相同的人分别获得 
哪些不同的职业类别，反映的是劳动力流出特定职业类别的情况。流入百分比 
记录的是职业获得相同的人分别来自哪些不同的职业类别，反映的是劳动力流 
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入特定职业类别的情况。数据显示出，在美国，不同的职业类别在流入和流岀 
两方面都具有相当大的差异。即使是对特定的职业类别来说，流入和流出情况 
也大有不同。 


表 1.2 父亲的职业与儿子的第一份职业之间的流动 :流入 和流出百分比 


父亲的职业 

上层非体力 

儿子的第一份职业 
下层非体力上层体力下层体力 

农民 

合计 

流入百分比 

上层非体力 

34.5 

17.6 

11.5 

8. 1 

1.8 

14.7 

下层非体力 

17.7 

17.7 

9.7 

8.8 

2. 1 

11.3 

上层体力 

19.5 

21.9 

32. 6 

21. 1 

4.8 

20. 5 

下层体力 

18.4 

30.8 

29.4 

41.8 

10. 5 

30. 1 

农民 

10.0 

12.0 

16.8 

20. 2 

80. 9 

23.4 

合计 

100.0 

100.0 

100.0 

100.0 

100.0 

100.0 

流出百分比 

上层非体力 

48.4 

17.8 

10. 3 

22. 0 

1.4 

100.0 

下层非体力 

32. 1 

23. 3 

11. 3 

31.2 

2. 1 

100.0 

上层体力 

19.5 

15. 9 

20. 9 

41.0 

2. 6 

100.0 

下层体力 

12.6 

15.2 

12.8 

55.4 

3. 9 

100.0 

农民 

8.8 

7.7 

9. 5 

34. 6 

39.4 

100. 0 

合计 

20. 6 

14. 9 

13.2 

40.0 

11.4 

100.0 


仅仅计算流入和流出百分比只是一种非常粗浅的分析手段。虽然它们所 
提供的信息有助于理解社会分层的过程，但不同的社会阶层在劳动力供给和需 
求上的相对数量消长以及它所连带的其他社会过程也会影响最终的流入和流 
出模式。例如，农民的高生育率以及美国劳动力中农业人口比例的下降这两个 
原因，最终导致了农民这一职业类别在流入/流岀模式上的失衡。虽然只有 
39. 4%的农民后代与他们的父亲一样继续从事农业工作，但1973年时，却仍然 
有 80. 9%的农业工作者出身于农民家庭。本书所介绍的统计建模技术要实现 
的目标之一，就是控制美国(或其他国家)经济结构变化所带来的劳动力需求重 
新配置以及不同社会群体在生育率上的差异等外部力量的影响。 

另一个初步分析方法是计算相异指数，它既可以指两类职业出身之间流出 
比例的相异性，也可以指两类职业获得之间流入比例的相异性，具体计算方法 
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是把每一组对应比例之间的顺差加总。例如,下层体力职业类别与农民职业类 
别之间流出比例的相异指数的计算方 法为： 

A = (0. 126 - 0. 088) + (0. 152 — 0. 077) + (0. 128 — 0. 095)+ (0. 554 — 0. 346) 
= 0. 354① 

这个相异指数测量的就是为使这两类职业的流岀比例分布达到相同所需重新 
划分的人数比例。表 1. 3给岀了每两类职业出身之间和每两类职业获得之间的 
相异指数。 


表 1.3 父亲的职业与儿子的第一份职业之间的 流动: 
每两类职业出身之间(对角线下方)及每两类职业 
获得之间 ( 对角线上方)的相异指数 


职业出身类别 

上层非体力 

职业获得类别 
下层非体力 上层体力 

下层体力 

农民 

上层非体力 

— 

0. 169 

0. 310 

0. 353 

0. 483 

下层非体力 

0. 163 

— 

0. 155 

0. 192 

0. 688 

上层体力 

0. 308 

0. 200 

— 

0. 158 

0. 640 

下层体力 

0. 384 

0. 276 

0. 157 

— 

0. 607 

农民 

0. 499 

0. 407 

0. 367 

0. 354 

— 


流动表的卡方检验 


还有一个常用的初步分析工具就是卡方检验。在列联表数据分析中，卡方检 
验的零假设一般都不存在相关关系，这一点当然也适用于流动表。事实上，卡方 
检验所假设的统计独立模型在流动表分析这一研究背景下更具实质性的意义。 

假定流动表中的职业出身变量分布在考虑了父代的劳动力需求状况和各 
职业群体的岀生率之后是不变的，再进一步假定流动表中的职业获得变量分布 
在考虑了某国经济结构对子代的劳动力需求特征之后也是不变的。如果子代 


①等式中的括号在原文中没有，为译者所加。——译者注 
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仅仅是在职业出身和职业获得这两个边缘分布的限制下随机进入到不同的职 
业中去，也就是说，当职业获得与职业出身这两个变量在统计上相互独立时，就 
实现了完全社会流动，因为个体流动到任意一类职业位置上的发生比完全是由 
职业获得变量的边缘分布所决定的。这就是为何大家所熟悉的统计独立模型 
经常被称为“完全流动模型”的原因。在完全流动模型中，每一类职业岀身（即 
每一行)的流出百分比是完全相同的，因此，每两类职业出身之间的相异指数全 
都为 0( 对职业获得这一列变量而言也是如此)。当然，在现实的流动表中，每一 
行或每一列的比例分布很难完全相同。因此，研究者就要借助卡方检验来判定 
实际观察到的流动模式与完全流动模型之间的差异是否可归结为仅仅由抽样 
误差所导致。 

对完全流动模型进行卡方检验的第一步是计算该模型成立时的期望频数。 
具体计算方法与一般的卡方检验并无 二致： 

Fy = njnj/N [1. 1] 

上式中的 N 表示全部样本数，仏和1^分别表示职业岀身变量和职业获得变 
量的边际频数流动表卡方检验的唯一特殊之处就是独立模型（即不存在统 
计相关)具有完全流动模型的意义。表 1. 4给岀了根据美国流动表数据计算得 
到的期望频数。 


表 1.4 父亲的职业与儿子的第一份职业之间的 流动: 完全流动模型下的期望频数 


父亲的职业 

上层非体力 

儿子的第一份职业 
下层非体力上层体力下层体力 

农民 

合计 

上层非体力 

601. 39 

434. 66 

384. 80 

1167. 00 

332. 15 

2920 

下层非体力 

464. 02 

335. 37 

296. 90 

900. 43 

256. 28 

2253 

上层体力 

841. 54 

608. 22 

538. 45 

1633. 00 

464. 78 

4086 

下层体力 

1236. 36 

893. 58 

791.07 

2399. 15 

682. 84 

6003 

农民 

957. 70 

692. 18 

612. 78 

1858. 41 

528. 94 

4650 

合计 

4101 

2964 

2624 

7958 

2265 

19912 


①即第 i 行样本数的加总和第 j 列样本数的加总。——译者注 




常见卡方检验的第二步是根据下面的公式将期望频数和观测频数进行 
比较： 

x 2 = [1. 2] 

i j 

在大样本且零假设为真的条件下，该统计量接近于卡方分布，自由度为 (R — I ) 2 
( R 等于列联表中的行数或列数)。在许多情况下，人们都将公式 1. 2直接视为 
“卡方”本身，但这是不准确的。尽管当零假设为真且样本量足够大时，该统计 
量确实接近于卡方分布，但卡方分布的计算公式本身并不是这样的。因此在本 
书中，我将把公式 1. 2中的统计量称为 X 2 。另一个在同等条件下也接近于卡方 
分布的统计量也经常被 用到： 

V = 2 ^] XlfijlogCfij / Fij ) [1. 3] 

i j 

上式中的 log 表示的是取自然对数。 L 2 与 X 2 在计算公式上大相径庭，但它在零 
假设为真且样本量足够大的条件下也满足自由度为 (R — I ) 2 的卡方分布。 

如果关于完全流动的零假设是错的，那么， X 2 与 L 2 两个统计量的计算结果 
都将大于相应的卡方值。因此，检验完全流动模型的方法就是计算 X 2 和 L 2 , 并 
将它们与根据卡方分布表所查到的相应卡方值进行比较。如果 X 2 和 L 2 都小于 
相应的卡方值，我们就无法拒绝关于完全流动的零 假设; 如果 X 2 和 L 2 都大于相 
应的卡方值，我们就可以拒绝关于完全流动的零 假设; 如果相应的卡方值恰好 
在 X 2 与 L 2 之间(这种情况很少见），检验的结果就不确定。 

引进 L 2 统计量的目的并非是要核对使用 X 2 作为统计量的结果，也并非是 
为应对可能出现的卡方值恰好处于 X 2 与 L 2 之间的情形，而在于它在统计上是 
可以被分解的，且这种统计分解具有实质性的意义(但 X 2 却并不具备这种特 
性）。其实， L 2 的确是更好的统计量， X 2 之所以也被用到，是因为它为人们所广 
泛熟知。将上述计算方法应用于表 1. 1的数据后，得出当自由度等于16时， X 2 
值为 7166. 77, L 2 值为 6170. 13 0 再查表得知，在16个自由度下，卡方分布的 
95%分位数上的相应值是 26. 30。因此，关于完全流动的零假设明显被拒绝。 

另一个反映模型拟合度的指标是实际频数和期望频数之间的相异指数。 



虽然这一相异指数并没有检验关于完全流动的零假设(或其他任何零假设），但 
由于它可以被解释为被模型错误划分的人数比例，因此对研究者来说也相当有 
吸引力。根据表 1. 1所报告的实际频数和表 1. 4所报告的期望频数，它们之间 
的相异指数为 0. 201。这表示，完全流动模型对表 1. 1中的个案划分出现了约 
1/5的错误。 

优比 

一个较为深入的分析是计算相邻行与列的优比，它会在本书随后的章节中 
显示出其重要性。对一个 2 X 2 的列联表而言，表中的相关关系可以用优比或叉 
积比来 测量： 

OL = fll ^2 / fl 2 Ul [1. 4] 

有时也会使用 (X 的变式（例如，取 (X 的自然对数 ）（ Goodman ，1969 a 、1969 b 、 
1979 a ； Davis , 1974; Fienberg, 1980)。 若 a 大于 1，则表示正 相关; 若 ct 小于 1， 
则表示负相关。由于任何一个流动表都是由许多这种相邻的行与列所组成的 
2 X 2 表所构成，所以一个 RXR 表中的相关关系就可以用 ( R — I ) 2 个优比来表 
达 ( Goodman ，1979 a )。 值得注意的是，行与列的分类次序会直接影响优比的计 
算结果。古德曼 (1979 a ) 将这些 2 X 2 表称为列联表的“基本单元”。除此之外， 
所有其他的分表所包括的信息都是多余的。因此，通过如下公式计算得岀 
( R -1) 2 个优比或者它们的变式值，就获得了流动表中所有的相关关系信息。 

ay = fijfn - i , j+i / fn - i , jfi , H-i [1. 5] 

请注意，在检验完全流动模型时有多少自由度，就有多少 2 X 2 表和多少优 
比。这并不是巧合。针对同一个流动表中所蕴含的相关关系的任意一个统计 
模型设计,都可以由该模型所预示的重要优比的数目来概括(如果 a = 1.0,就 
说明它是一个不重要的优比）。完全流动模型意味着所有的％都等于1.0。在 
随后的章节中我们会看到，完全流动模型以及比它更复杂的流动模型下的优比 
所呈现出来的不同模式构成了模型之间相互比较的基础。正如前文所言，优比 
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的模式取决于职业类别的排列次序。并不是所有的排列次序都同样适用于统 
计建模，但只要研究者采用了“正确的”排列次序，优比就是有用的。从美国流 
动表数据所观察和计算得到的优比都显示在表 1. 5中。值得注意的是，优比的 
4个最大取值都岀现在对角线上。要设计更为精致复杂的理论模型，必须充分 
考虑到这一重要信息。 


表 1.5 表 1.1 中基本 2 X 2 分表的优比值 

职业获得比较 

职业出身比较 5:4 4 : 3 3: 


: 4 

1. 964 

0. 836 

1. 300 

1. 098 

: 3 

1. 122 

2.725 

0.707 

0. 944 

: 2 

1.489 

0. 639 

2.203 

1. 106 

:1 

0.722 

1.464 

0. 847 

15. 954 


流动比率 


在介绍比完全流动模型更复杂的统计模型之前，我想先谈谈流动比率的问 
题。流动比率这一概念由戈尔达梅 （ Goldhamer ) 首先提出，并经由罗格夫 
( Rogoff ) 的推广而流行。对流动表中的任意一个单元格来说，流动比率指的就 
是这个单元格的实际频数与完全流动模型假设下的期望频数 之比： 

Rij = fij/Fy [1. 6] 

尽管 Ry 在进行探索性分析时确实有用(例如， Hauser ，1979) ，但在更多的情况 
下，它却是被当做测量职业出身和职业获得两个变量之间相关关系的一个指标 
来使用。遗憾的是，氏其实并不能测量这种相关性。 

将流动比率视为相关性的测量指标这种做法，乍看之下似乎顺理成 章:既 
然它表示的是实际频数与不存在相关关系情况下的期望频数之间的比值，那 
么，它作为一个指标当然就能反映出相关程度的大小。然而，仔细分析之下却 
会发现，这种理解其实站不住脚，具体而言有3个原因。 

第一，正如布劳和邓肯 （1967: 93—97) 所展示以及泰里 （ Tyree ，1973) 所阐 






释的那样，如果两个流动表所蕴含的职业出身和职业获得之间的相关模式完全 
相同而仅仅在边缘分布上有所差异，那么它们的流动比率则必然不同。这也是 
流动比率概念遭受批评最多的一点。对流动比率概念的另外两个批评意见都 
或多或少与此有关。 

第二个批评指出，流动比率是基于完全流动模型计算出来的，而这一模型 
却并不拟合大多数的经验数据 ( Goodman , 1965、 1969 b ； Hauser , 1978、1979、 
1981)。既然它的模型基础是错的，那么，它所反映的信息就同时囊括了系统性 
的相关和误差。这是因为，每一个单元格的频数都由边缘效应、系统性相关和 
误差(包括测量误差和抽样误差)共同决定。流动比率概念的拥趸认为，它反映 
了系统性相关和边缘效应的相对情况，但却并不承认误差的存在及其重要性。 

尽管计算流动比率时会出现误差，但如果误差相对于系统性相关而言并不 
严重，并且按照完全流动模型所计算的边缘效应是对真实边缘效应的无偏估 
计，那么，流动比率作为职业出身和职业获得之间的相关性测量指标就仍然是 
可以接受的。然而，上述条件在真实数据中却很少成立。 

对流动比率的第三个批评是，实践中如果没有一个与数据相拟合的模型用 
来作为参照，研究者就无从评估误差的相对重要性和系统性的相关到底有多 
大。而一旦找到了能够拟合数据的这一模型，就不再需要计算流动比率了，因 
为该模型的参数本身已经可以更好地反映流动表所蕴含的相关性。 

霍普 ( Hope ，1981) 曾试图为流动比率概念做辩护，其理由是，对任何给定 
的流动表而言，它的取值都是不变的，而其他替代性参数的取值则都随模型的 
拟合度而不同。但流动比率的问题恰恰就在于它的不变性 :不管 与给定的流动 
表相拟合的正确模型到底如何，流动比率永远保持同样的取值。因此，流动比 
率最多只能提供一个并不完整的线索，以探索流动表中所隐藏的相关关系结构 
(Hauser, 1979)。更糟糕的是，这一概念经常会起误导作用。总而言之，流动比 
率不应该被当做对相关性的测量。 




第 2 章 I 流动表的部分独立 


第1章有关卡方检验的部分已经提到，完全流动模型并不能拟合表 1. 1中的 
美国社会流动数据。我现在就介绍更为复杂的模型。本章将要涉及的模型将完 
全流动仅限定于职业出身和职业获得的某些组合，而将其他组合情况视为存在流 
动障碍。在表格的完全流动区域中，职业获得与职业出身具备统计上的独立性， 
但在表格的其他区域，它们之间却存在显著相关。许多最近的社会流动研究文献 
都探讨了这一议题，即存在于某些职业类别之间的完全流动以及横亘于其他职业 
类别之间的流动障碍(例如， Hauser ， 1978、1979； Breiger , 1981)。 

寻找流动障碍的首要着眼点在流动表的对角线位置。美国流动表数据中 
实际频数和期望频数之差表明，真实社会中所存在的不流动情形要远甚于完全 
流动模型的假设。这一特征确实很常见。社会流动研究已经不断证实了这种 
“过度的”不流动性的存在（例如 ， Lipset & Bendix , 1959； Blau & Duncan , 
1967； Featherman & Hauser , 1978)。 古德曼的准完全流动模型 （ QPM )(1961 、 
1965、1968、 1969 a 、1969 b 、1972 a ) 针对的正是这一不流动情形，它会被首先加 
以介绍。我也会提及准完全流动模型的一般化形式，它加入了对非对角线位置 
上的向上或向下流动类型所作出的约束。这又具体包括两个模型，其一是允许 
流动障碍还出现在职业地位序列的两端 （ Goodmand ， 1965、 1972 a ； Pullum , 
1975) ，其二是允许存在系统性的流动障碍。 

定义准完全流动 


为分析对角线上集中了过多个案的流动表，几位研究者 （Blumen et al . ， 



1955； Goodman , 1961、1965、 1969 a 、1969 b ； White, 1963) 都提出了将流动和 
不流动加以区分的流动模型。以古德曼的模型为例，观察到的流动模式被视为 
两个过程的共同结果。第一个过程是不流动部分，它使得特定的一群人—— 
“滞留者”——处于与其岀身相同的职业位置上。第二个过程是流动部分，类似 
于完全流动的情况，因为其余人群的职业获得不因职业出身而有所不同。在后 
一个过程中，某些个体仍然有可能从事与他们的岀身相同的职业。虽然这些人 
貌似那些滞留者，但却与他们不同。“滞留者”之所以没有离开他们的职业岀 
身，乃是由模型未能解释的某些结构性力量所致，而移动者中职业获得与职业 
岀身相同的情况则纯属偶然，就像那些职业岀身与职业获得不同的人一样，他 
们最终进入哪种职业类别都是随机的。 

古德曼的模型其实是对布吕芒 (Blumen et al. ， 1955) 所提出的移动者一滞 
留者模型的进一步发展。最初的移动者一滞留者模型依据职业获得的不同对 
人群进行划分。凡是职业获得与职业岀身相同的人都被划分为滞留者。根据 
这个模型，只有职业出身和职业获得不同的人才是被随机过程所主导的，完全 
流动被认为是以移动事实的发生为条件的。虽然古德曼的准完全流动模型沿 
袭了移动者 一 滞留者模型及其扩展模型 （Singer & Spilerman, 1974、 1976) 的 
一贯思路，但它的内在逻辑却更为严谨，同时也与其他流动模型具有更高的一 
致性。在移动者一滞留者模型中，只有滞留者才是不流动的。但在准完全流动 
模型中，移动者中的某些人也是不流动的，这是岀自偶然因素的作用。他们是 
服从完全流动模式，但只不过恰好发生职业获得与职业出身相同这种情形的一 
群人。如若不然，在这群人中将会不可避免地岀现职业出身与职业获得相关的 
情形，而这是完全流动所不允许的(按照定义，只有当职业出身与职业获得相互 
独立时，完全流动才得以存在)。 

准完全流动的对数线性模型 

在用文字说明了模型的基本原理之后，现在我将用更严谨的数学公式来进 
行表述。为此，先要简单介绍一下对数线性模型的数学表达方法。对一个两维 



流动表分析 


列联表(包括流动表)而言，对数线性模型的一般形式为： 

log(Fij) = ao + au + a 2 j + bij [2. 1] 

上式中的 ao 表示总均值， a u 表示行效应， a 2 j 表示列效应， bij 表示行与列的交互效 
应。这些参数服从下列 约束： 


2 a ii = 2 a 2j = 0 [2. 2] 

• • 

1 J 

和 

2 bij = bij = 0 [2. 3] 

i j 

当交互效应不存在时(即所有的4都等于0时），我们就得到了完全流动模型。 
如果所有的 h 都不等于0,我们得到的就是饱和模型，该模型用完了流动表数据 
中所有的自由度，并且与经验数据完全吻合。本书此后的章节所涉及的模型全 
都处于完全流动模型与饱和模型之间。这些模型都是对 W 作出某种约束以避 
免它们都等于0或都不等于0,也就是试图在并不用完所有自由度的情况下，获 
得一个可以接受的模型拟合度。 

公式 2. 1也可以被写为相乘 形式： 

Fy = Ao An A2jBy [2. 4] 

与公式 2. 1 —样，公式 2. 4 中的参数也必须服从类似的两个约束，其相乘形式 


如下： 




11 Aii = A.2] — 1 

i j 

[2. 5] 

和 




11 By = JjBij = 1 

i J 

[2. 6] 


对数线性模型和相乘模型中的参数具有简洁的对应关系，即 au = logCAn ), 
a 2j = log ( A 2j ), b ^ logCft ^ o 因此，当所有的玛都等于 1 时，我们就得到了完全 
流动模型，公式 1. 1与公式 2. 4在这种情况下就是等同的。为节省篇幅，本书将 
只采用对数线性的数学形式来对模型进行表述。 
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之所以需要公式 2. 3 这一约束条件，是因为公式 2. 1 中的参数个数超过 
了自由度的个数。这一约束条件的存在使我们不必估计 2R-1 个交互项参 
数，因而才能够对饱和模型进行估计。但对准完全流动模型来说，只有当对 
角线上的 h 不等于0时，也就是说，不等于0的参数个数少于自由度的个数 
时，公式 2. 3 这一约束条件就不需要了。准完全流动模型的对数线性方程表 
达 如下： 

log(Fij) = ao + au + a 2 j + bii ①（当 i = j 时） [2 7] 

logCFij ) = ao + au + a 2 j (当 i # j 时） 

公式 2. 2 这一约束条件仍然适用。公式中的 bu 表示的正是继承效应，它们是模 
型中仅有的交互项参数，测量了对角线单元格上的个案分布偏离完全流动模式 
的程度。适用于非对角线单元格(即 i^j 的单元格）的公式与完全流动模型的 
公式是相同的，除了它必须要求 i 不等于 j 这一条件之外。准完全流动模型比完 
全流动模型多用了 R 个自由度——每增加一个&就多用一个自由度，因此，它 
的自由度计算公 式为： 


dfQPM — (R 一 I) 2 — R 

对准完全流动模型下 Fg 的计算是通过“屏蔽”或删除对角线上的个案之后，再 
对剩余的流动表数据按独立模型进行估计得到的。然而，正是由于对角线上 
的单元格被排除在外，所以就不能再用公式 1. 1来计算剩余单元格的 Fg 。除 
了极特殊的情况以外 （Bishop et al. ，1975:192— 206) ，一般都需要用到迭代 
方法。 

准完全流动模型的结果 

准完全流动模型也并不能很好地拟合表 1. 1中的美国流动表数据。无论以 
哪个常用的显著性水平来衡量， L 2 和 X 2 都超过了相应的卡方值。但这并不意味 


①原文此处为 bi ， 应该是作者的失误，已改正。——译者注 
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着该模型所考虑的不流动情形不重要。因为与完全流动模型相比，准完全流动 
模型的这两个统计量都小得多， L 2 就减少了 5486. 79。还记得完全流动模型错 
误地划分了 20. 1%的个案吗(见表 1. 1)? 相比之下，准完全流动模型仅仅错误 
地划分了 5. 5%的个案。 

对 Fy 的估算见表 2. 1的上半部分。请注意，对角线上的数字并不是 Fu ，而 
是由偶然因素所导致的不流动的个案数 ( F 纟）。 这些估算结果是采用下述方法 
得到的。在前面的章节中，我已经介绍了优比这个概念，并且说明了在完全流 
动模型下，所有基本单元的优比均等于 1. 0的这种特性。在准完全流动模型下， 
完全流动只适用于移动者。因此，对角线上某个单元格的移动者个案数的估算 
原理就在于，凡是涉及这个单元格的所有基本单元的优比都必须等于 1. 0。让 
我们从流动表的中间位置开始。涉及对角线上第三个单元格的，有4个基本单 
元，它们的优比必须都等于 1. 0: 


Ot22 — F 22 F 33 /F23F32 — 1. 0 

«23 — F23 F34 / F 2 4 F33 — 1 . 0 [2 8 ] 

032 — F32 F43 /F33 F42 = 1. 0 
«33 — ^33 ^44 / F 34 ^43 = 1 . 0 

首尾两个方程都包含两个未知数，但中间的两个方程都只包含一个未 知数: 。 
用中间两个方程中的任意一个就可以求岀 F &。 例如，将第二个方程求解，即 得到: 

F 3 ； = F 23 F 34 / F 24 = (321. 81)(1645. 78)/(914.55) = 579. 11 

将这个数值分别代入首尾两个方程中，即可求得 F & 和 F ；；。 以此类推，即可得 
出 FA * F 5 〗 ，其计算公式分 别为： 


和 


Fn - F 21 F 12 /F 2 * 2 

f 5 5 = f 45 f 54 /f; 4 


由于本书在报告数据时，只保留了有限的几位小数，但上述计算过程却牵涉到 
小数位数的省略问题，因此，读者计算岀来的结果可能会有少许岀入。 
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表 2. 1父亲的职业与儿子的第一份职业之间的 流动: 准完全流动模型的估计结果 




职业获得 



职业出身 

上层非体力 

下层非体力 

上层体力 

下层体力 

农民 

(1) 期望频数 
上层非体力 

372. 17 

344. 01 

285. 54 

811. 49 

64. 96 

下层非体力 

419.43 

387. 70 

321.81 

914. 55 

73.21 

上层体力 

754. 79 

697. 68 

579. 10 

1645. 78 

131. 74 

下层体力 

934. 37 

863. 67 

716. 88 

2037. 33 

163. 09 

农民 

578. 41 

534. 64 

443. 77 

1261. 18 

100. 96 

(2) 参数估计值 
上层非体力 
下层非体力 
上层体力 
下层体力 
农民 

1. 335 

0. 301 

0. 391 

0. 490 

2. 898 


注: L 2 = 683.34; X 2 = 720.74; df= 11； p<0. 01； △ = 0.055。除非特别说明，本书表格中所报告的 
参数估计值都是就对数形式的方程而言。 


对参数 bu (即相加形式方程中的继承效应）的估计结果见表 2. 1的下半部 
分，其计算公式 如下： 

bii = logCfii/F^ ) [2. 9] 

一些统计软件，例如 FREQCHaberman, 1979)，能够直接对 h 进行估算，省去了 
研究者手工计算的麻烦。表 2. 1给岀的这些的参数值说明，继承性在农民职 
业阶层中表现得最强 （ b 55 = 2. 898)，其次是上层非体力职业阶层 （ b u = 
1. 335 ①），接下来依次是下层体力职业阶层和上层体力职业阶层，最弱的是下层 
非体力职业阶层。其实不用太在意这种次序，因为这一模型与数据并不拟合。 
况且， b 22 和 b 33 其实非常接近，而 b 44 也与这两个数值相差不大。 


存在于顶端和底端的流动 障碍: 边角模型 


准完全流动模型更一般化的形式是在屏蔽对角线上的单元格之后再屏蔽 


①原文为^，似为作者的失误，此处已改正。——译者注 




非对角线上的某些单元格。古德曼 （1965) 和普勒姆 ( Piilhim ，1975) 认为，准完 
全流动模型之所以并不拟合数据，是因为职业地位层级的两端存在“过多的”短 
距离流动。至于何为“短距离”和“职业地位层级的两端”，取决于流动表中职业 
分类的具体排列次序。他们假设，发生于下层非体力职业阶层与上层非体力职 
业阶层之间的流动，其实与准完全流动模型所预期的这两个职业阶层的继承性 
并没有太大的不同。他们还假设，与准完全流动模型所预期的情形相比，农民 
职业阶层的后代进人下层体力职业阶层的期望频数以及相反情形（即下层体力 
职业阶层的后代进入 k 民职业阶层)下的期望频数其实会更高。由于这种理论 
模型并没有一个公认的命名，我将称之为“边角模型”。 

对边角模型的正式表述是，它不仅拟合了对角线上的 R 个参数(在这一点 
上与准完全流动模型相同），并且还拟合了边角单元格（1，2)，（2, 1)， （ R — 1， 
R ), ( R , R —1) 上的4个 参数： 

log ( Fjj ) = ao + aii + a2j + by Zij [2. 10] 

上式中的％与 a 2 j 之和必须为 0( 其道理与公式 2. 2 相同），并且当 i = j 或者第 
( i ， j ) 格是一个边角单元格时，1。与公式 2.1 相比，多岀的参数 Zu 旨在令 
边角单元格上的实际频数与期望频数相等。既然每当1时就损失一个自 
由度 ® ，它的自由度就是 （ R — l ) 2 — (R + 4)。 

尽管对美国的流动表数据而言，边角模型的岀发点是为了拟合过多的短距 
离流动，但其实该模型也可以拟合与此相反的情形，即过少的短距离流动。第 
( i ， j ) 单元格上的个案数到底是过多还是过少，从 h 的符号上可一见分晓 :如果 
h 是正值，就表示第 ( i ， j ) 格上的实际个案数比准完全流动模型所预期的 要多； 
如果^是负值，就表示观测频数比期望频数要少。 

根据表 2. 2中的结果，边角模型比准完全流动模型更好地拟合了美国的流 
动表数据，但是，它的拟合度在常用的显著性水平下仍然尚未达到可以接受的 
水平。由于该模型要精确地拟合对角线上的单元格和边角单元格，所以，这些 


①那么边角模型与准完全流动模型相比，就多用了 4个自由度。——译者注 
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单元格上的个案数就是按照完全流动模型所估计的期望频数。的计算原 
理和过程与准完全流动模型类似。例如，计算时会用到方程 F 〗 - F 31 F ； 2 / F 32o 
得到 F 『后 ，模型中的每个参数值都可以用如下公式来计算： 

bij = log(fii/Fi-) 

在解释这些参数时务必小心谨慎，因为该模型与数据并不拟合，当然它们 
也不是太离谱，这一点会在随后的分析中再加以说明。表 2. 2中的这些参数值 
表明，农民阶层的继承性非常之高，但上层非体力职业阶层的继承性在强度上 
降低了一半，而从下层非体力职业阶层向上层非体力职业阶层的流动性强度 
(与这种上层非体力职业阶层的继承性强度相比）又降低了一半。此外，有5个 
单元格上的参数值几乎相当，在数值大小上都处于中间位置，它们分别是第 
(1， 2) 格、第(4, 5) 格和第(5, 4 )格以及2个对角线上的单元格，即第（2, 2) 格 
和第(4, 4 )格。最后，边角模型中上层体力职业阶层的继承性与根据边缘效应 
所预期的情形大体一致(随后的分析会表明， b 33 在统计上确实是不显著的）。 


表 2. 2父亲的职业与儿子的第一份职业之间的 流动: 边角模型的估计结果 


职业出身 

上层非体力 

职业获得 

下层非体力 上层体力 

下层体力 

农民 

(1) 期望频数 






上层非体力 

286. 48 

280. 06 

279. 12 

662. 89 

42. 99 

下层非体力 

292. 29 

285. 74 

284. 79 

676. 35 

43. 87 

上层体力 

727. 22 

710. 92 

708. 56 

1682. 75 

109. 14 

下层体力 

826. 90 

808. 37 

805. 69 

1913.42 

124. 10 

农民 

408. 88 

399. 71 

398. 39 

946. 13 

61.36 

(2) 参数估计值 






上层非体力 

1. 597 

0. 621 




下层非体力 

0. 907 

0. 606 




上层体力 



0. 189 



下层体力 




0. 553 

0. 647 

农民 




0. 532 

3. 396 


注： L 2 = 50. 12; X 2 = 50. 44； df = 7; p < 0. 01; A = 0. 014。 
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对称相关 


准完全流动模型在流动表分析中是一个重要的基准模型。许多研究者都 
以它为基础再加入更多的参数以使模型能够拟合数据。边角模型就体现了这 
种研究策略。另外一个重要的基准模型则是对每个单元格都拟合一个交互项 
参数，同时约束这些参数具有对称性的特征 ( Goodman ， 1968、 1972 c ; Knoke 
Burke , 1980：49 一 54) : 

Fij = ao + au + a。 + bij [2. 11] 

上式也需服从公式 2. 2 和公式 2. 3 的条件约束，并且令 h h 。这就是大家所 
知道的“准对称模型” ( QS )。 应用这一模型，研究者就能用各个国家的流动表数 
据来检验职业阶层之间的流动是否具有对称性。如果准对称模型能够拟合数 
据，那么就不必再考虑非对称模型。如果准对称模型不能拟合数据，研究者可 
以渐次加入非对称参数，使最终模型的非对称参数的个数保持在最低限度。 

有两个模型与准对称模型具有密切联系。第一个是对称模型 （ S )， 它不仅 
将交互项参数约束为对称，而且将边缘效应也约束为对称： 

Fy = ao + an + aij + by [2. 12] 

上式也需服从公式 2. 2 和公式 2. 3的条件约束，并且令 h = b iU 在对称模型下， 
边缘效应参数和边缘分布频数对职业出身和职业获得两个变量来说都相等。 

第二个是边缘齐性模型 ( MH ) 。 在这一模型下，交互效应并不对称，但职业 
岀身与职业获得的边缘分布却相同。边缘分布相同与边缘效应相同是两码事。 
由于 MH 模型下的交互效应并不具有对称性，边缘效应就不可能相同，边缘分 
布本身也不可能相同。事实上， MH 模型并不是一个对数线性模型，但它可以 
用对数线性方法来检验，因为它的拟合度就等于 S 模型的 L 2 值和 QS 模型的 L 2 
值之差。 

表 2. 3显示了 S 模型和 QS 模型的期望频数以及 S 模型、 QS 模型和 MH 模 
型各自的拟合度。然而，将 QS 模型和 QPM 模型进行比较就会发现，表 1.1 中 
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表 2. 3父亲的职业与儿子的第一份职业之间的 流动: 对称模型与准对称模型的期望频数 




职业获得 



职业出身 

上层非体力 

下层非体力 

上层体力 

下层体力 

农民 

(1) 对称模型 






上层非体力 

1414 

622. 50 

550. 00 

699. 50 

224. 50 

下层非体力 

622. 50 

524 

451. 00 

808. 50 

202. 50 

上层体力 

550. 00 

451. 00 

856 

1223. 50 

274. 50 

下层体力 

699. 50 

808. 50 

1223. 50 

3325 

924. 00 

农民 

224. 50 

202. 50 

274. 50 

924. 00 

1832 

(2) 准对称模型 






上层非体力 

1414 

575. 88 

289. 06 

599.01 

42.06 

下层非体力 

669. 12 

524 

264. 16 

752. 30 

43. 42 

上层体力 

810. 94 

637. 84 

856 

1657. 81 

123. 40 

下层体力 

799. 99 

864. 70 

789. 18 

3325 

224. 13 

农民 

406. 94 

361. 58 

425. 60 

1623. 87 

1832 


L 2 

X 2 

df 

P 

△ 

对称模型 

2804. 87 

2562. 79 

10 

<0.01 

0. 118 

准对称模型 

27. 45 

27.35 

6 

<0.01 

0.011 

边缘齐性模型① 

2777. 42 

— 

4 

<0.01 

— 


非对角线单元格上的相关模式几乎都具有对称性。豪斯 （1981) 已经表明，只要 
将两个非体力职业阶层之间的（向上和向下）流动，即第（1， 2) 格和第（2, 1) 格 
设定为一组非对称参数，改进后的模型就能相当好地拟合数据 ( L 2 = 7.79; 
X 2 = 7. 78； df =5； p = 0. 26； △ = 0. 005)。这显示了 QS 模型作为一个诊断模 
型的作用 （ Hauser ， 1979)。邓肯 （1981) 还展示了在分析面板数据时，如何运用 
S 模型、 QS 模型和 MH 模型②。 


① 原文为“边缘对称模型”，但为了与正文部分的模型名称保持统一，这里译为“边缘齐性模 
型”，其实，两者所要表达的意思本质上是相同的。 一 译者注 

② 原文为 HM ， 似为作者的失误，此处已改正。——译者注 



第 3 章 I 社会距离模型 


前面所介绍的准完全流动模型和边角模型其实都可看做另一个更一般化 
模型的特殊形式，它是由古德曼 (1972 a ) 提出的。本章会介绍此一般化模型所涉 
及的更多的具体形式。这些模型都将职业类别按地位高低或其他维度进行排 
列。在大多数情况下，这种排列都假定相邻两个职业类别的间距是相同的。但 
最重要的假定是，某种社会流动的发生比是由它所跨越的职业类别界限所决定 
的。一些模型关心社会流动跨越了几个职业类别，另一些模型则关心社会流动 
跨越了哪些职业类别。不管是哪一种情况，如果职业类别的排列次序不清楚， 
则该模型就不适合。 

对角线约束模型 

本节介绍的模型是从古德曼 （1972 a : 661— 671) 的跨对角线模型 （ DC ) 发展 
而 来的： 

log ( Fij ) = ao + aii + a 2 j + q + dk + [3. 1] 

在上式中， 

k = i — j 

c u = 当 i > j 时， s 的取值为 j 到 i 一 1 

当 i < j 时， s 的取值为 i 到 j —1 
Uij = log(fij — ao — aii — a 2j — d k ) 当 （ i ， ： j ) G S 时 
Uij = 0 其他情况 
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# 


并且适用公式 2. 2。 S 表示的是模型所要屏蔽的单元格。 

最简单的对角线约束模型是将主对角线上的所有参数都设定为一个值 
( d 。）， 并用相同的职业类别分布来检验继承性是否真的超过了基于完全流动模 
式所预期的 情形： 

log ( Fij ) = ao + aii + a 2j + do [3. 2] 

并且适用公式 2. 2。这一模型被称为“准完全流动(约束)模型” ( QPM - C )。 这一 
模型只用了 1个4值(公式 3. 1中本来应该有5个 d k 值），并且没有用到 Cij 或 Uii 
参数(即公式 3. 1中的这些参数被设定为0)。与 QPM - C 模型相关的还有两个 
模型。第一个模型是进一步对次对角线上的参数作出如下 约束： 

log ( Fij ) = ao + aii + a 2 j + d|ki [3. 3] 

在上式中 ， I k | = | i—j | = 0 或1，并且适用公式 2.2。 这时，将次对角线上的所 
有参数也都设定为同一个值，因此该模型具有对称性，被称为“对角线对称(约 
束)模型” ( SI > C )。 第二个模型则是在第一个模型的基础上，放松次对角线上参 
数的这种对称性 要求： 

log ( Fjj ) = ao + a 。 + a 2 j + do + dk ① [3. 4] 

上式中的 k = i — j =— 1、 0 或1，并且适用公式 2. 2。该模型被称为“对角线(约 
束)模型”0>0。 

逐步放松对主对角线和次对角线参数的约束（即逐步加入叫项），就又产生 
了 4个模型。其中的一对模型都是放松对主对角线参数的约束，即在公式中加 
入可能的5个叫项，分别见公式 3. 5和公式 3. 6: 

log(Fy) = ao + a u + a 2 j + d | k| + 屮 [3. 5] 

log ( Fij ) = ao + a u + a 2j + d k + Uij [3. 6] 

在上式中，当 i = j 时， （ i ， j ) G S ， 并且适用公式 2. 2。这两个模型分别用 QSD-C 
和 QD - C 来表示，与前两个模型 SD - C 和 D - C 相比，多了一个字母 Q ， 它代表英文单 
词 “ quasi ” ，意思是屏蔽主对角线。另外一对模型是放松对次对角线参数的 约束： 


①原文的下脚标错误，此处改正。——译者注 
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log(Fij) = ao + au + a 2j + d | k | + [3. 7] 

在上式中，叫 = 叫，此外， 

log(Fjj) = ao + aii + a。+ dk + Uij [3. 8] 

& Jt 式中，当 一— 时， （ i ， j ) e s ， 并且适用公式 2 . 2 。 这两个模型被 
简写为 QSD 和 QD。QSD 并不属于公式 3. 1 所定义的模型系列，但它仍不失为 
一种理论概括。 

上述7个模型之间的异同可参见图 3. 1。图中用一些整数来代表交互项参 
数或每个单元格上交互项参数的组合。如果某个单元格上的数字等于另外一 
个单元格上的数字，就表明这两个单元格上的交互项参数是相等的。古德曼 
(1979 b :808) 提议将这种图示“作为不断启发思考的一个工具来使用，从而建构 
出更多的模型，以尽可能研究各种相关的、真切的社会现象”。 








■ 










mm 



























■ 





Hi 




QPM-C 






bh 

瞳§誠 












■ 






















■ 










■ 















HBI 








■ 





■ 










■ 





■ 












■ 





■ 









QSD-C 








1 

■ 




i 

6 




mm 

2 

7 



7 

2 

8 




7 

3 

■ 



9 

3 

10 




8 





11 

4 

12 




■ 

5 




13 

5 



QSD 





QD 




图 3.1 对角线约束模型的交互项参数设置 
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关于这7个模型的结果见表 3. 1和表 3. 2。表 3. 1虽然只显示了 3个模型 
的期望频数，但给出了每个模型的拟合优度(完全流动模型和准完全流动模型 
的拟合优度也一并列出以做比较）;表 3 . 2报告了所有模型的参数估计值。正如 
表 3. 1所显示的那样，没有一个模型在 0. 05的显著性水平上能够拟合数据。但 
需要说明的是， OCG-n 的样本规模增加了研究者寻找与数据相拟合的模型的 
难度。该调查的样本量实在太大，以至于对期望频数的任何微小的偏离在统计 
检验上都是显著的。样本量对统计显著性的这种影响的重要性从 A 值的变化 
上可见一斑。从 QPM 模型到 PM 模型，被错误地划分的个案比例仅仅减少了 
1/ 4 (从 20. 1%下降到 5. 5%)，但 QSD 模型进一步将个案错误地划分比例降低 

了 1/4( 从 5. 5%下降到 1. 3%) ， QD 模型更是将它降低了一半(从 1. 3%下降到 
0.6%) o 

表 3.1 父亲的职业与儿子的第一份职业之间的 流动： 

对角线约束模型的估计结果 


职业获得 


职业出身 

上层非体力 

下层非体力 

上层体力 

下层体力 

农民 

(1) QPM-C 模型的期望频数 





上层非体力 

1305. 68 

334. 77 

193. 18 

831. 09 

255. 28 

下层非体力 

372. 39 

814. 64 

160. 94 

692. 37 

212. 67 

上层体力 

750. 88 

562. 35 

947. 88 

1396.07 

428. 82 

下层体力 

857. 47 

642. 18 

489. 69 

3523. 97 

489. 69 

农民 

814. 58 

610. 06 

352. 04 

1514. 50 

1358. 03 

(2) SI>C 模型的期望频数 





上层非体力 

1414. 28 

474. 89 

224. 13 

618. 88 

187. 81 

下层非体力 

553. 00 

768. 31 

290. 07 

492. 24 

149. 38 

上层体力 

615. 02 

683. 51 

1067. 74 

1449. 41 

270. 32 

下层体力 

746. 14 

509. 62 

636. 82 

3576. 80 

533. 62 

农民 

772. 56 

527. 67 

405. 23 

1820. 67 

1123.87 

(3) QSI>C 模型的期望频数 





上层非体力 

1414 

481. 92 

243. 66 

718. 48 

61. 95 

下层非体力 

590. 48 

524 

361. 34 

715. 49 

61. 69 

上层体力 

639. 21 

773. 66 

856 

1717.68 

99. 45 

下层体力 

906. 04 

736. 38 

825. 66 

3325 

209. 92 

农民 

551.27 

448. 04 

337. 34 

1481. 35 

1832 
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续表 


职业出身 

上层非体力 

职业获得 

下层非体力 上层体力 

下层体力 

农民 


L 2 

X 2 

df 

P 

△ 

PM 

6170. 13 

7166. 77 

16 

<0.01 

0. 201 

QPM-C 

2480. 14 

2266. 81 

15 

<0.01 

0. 125 

SD-C 

1955. 97 

1905. 68 

14 

<0. 01 

0. 112 

D-C 

1952. 96 

1902. 62 

13 

<0.01 

0. 113 

QPM 

683. 34 

720. 74 

11 

<0. 01 

0. 055 

QSD-C 

333. 80 

333. 00 

10 

<0.01 

0. 042 

QD-C 

327. 857 

327. 79 

9 

<0. 01 

0. 041 

QSD 

33. 63 

33. 52 

7 

<0.01 

0.013 

QD* 

15. 54 

15. 48 

3 

<0.01 

0. 006 


表 3. 2父亲的职业与儿子的第一份职业之间的 流动: 
对角线约束模型的交互项参数估计值 


参数 

QPM-C 

SD-C 

D-C 

QPM 

QSD-C 

QD-C 

QSD 

QD 

do 

1.072 

1. 197 

1. 194 

1.083 

1. 262 

1.256 

1.226 

1. 233 

d iu 

— 

0. 487 

0. 456 

— 

0. 398 

0. 350 

0. 233 

0.219 

did 

— 

0. 487 

0. 505 

— 

0. 398 

0. 422 

0. 233 

0. 254 

Un 

— 

— 

— 

0. 252 

0. 005 

0. 005 

0. 483 

0. 444 

U22 

— 

— 

— 

-0. 782 

-0. 776 

-0. 767 

-0. 734 

-0. 736 

U33 

— 

— 

— 

— 0. 692 

-0. 479 

-0. 491 

—1. 290 

-1.311 

U44 

— 

— 

— 

— 0. 593 

— 0. 552 

— 0. 550 

_ 0. 694 

一 0. 690 

U55 

— 

— 

— 

1.815 

1. 800 

1. 802 

2.237 

2.293 

U12 

— 

— 


— 

— 

— 

0. 540 

0.378 

U23 

— 

— 

— 

— 

— 

— 

_ 0. 506 

一 0. 521 

U34 

U45 

_ 

_ 

_ 

_ 

_ 

■■ 

— 0. 388 

0. 345 

-0. 348 

0. 492 

U21 

U32 

— 

— 

■ 


_ 


0. 540 

0.506 

0. 648 

0. 535 

U43 

— 

— 

— 

— 

— 

— 

_ 0. 388 

— 0. 449 

U54 


— 

— 

— 

— 


0. 345 

0. 335 
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从表 3. 1和表 3. 2可以得出的第一个结论是，职业的代际继承性是很强的， 
尤其是在职业序列的两端(即顶端的上层非体力职业阶层和底端的农民职业阶 
层）。叫出现负值并不意味着不存在职业地位的继承性 ( Goodman ， 1965)，因为 
它们表示的是对相应 d k 值的偏离情况，而且，既然 Uij 的和被约束为0,那么自然 
会有一些负值出现。山和叫①两个交互效应相加为负值的情形，只在 QSD 和 
QD 两个模型的第三个对角线单元格上出现，但数值本身并不大。 

第二个结论是，职业岀身和职业获得之间的相关模式大体上具有对称性。 
将相互对应的对称模型和非对称模型进行比较时发现，只有最后两个模型 
(即 QSD 和 QD ) 之间存在显著地偏离对称性特征的情形 （ L ^- Ud = 
18. 09; df = 4； p < 0. 01)。仔细检查这两个模型的叫值发现，最大的不对 
称性存在于第（1， 2) 格与第（2, 1) 格之间。从数据看来，从下层非体力职 
业阶层向上层非体力职业阶层的向上流动要多于反向的向下流动。 Uij 值所 
体现的另一个可能的不对称性存在于第（4, 5) 格与第（5, 4) 格之间，但这 
或许并不显著，因为第（4, 5) 格上的样本数很少。正如在第2章对称相关 
部分所提到的，模型中不对称参数的设计只需考虑第（1， 2) 格与第（2, 1) 
格这一组关系即可。 

阶层隔阂与跨越参数 

到目前为止，我们尚未论及等式 3.1 中的参数 Cij 。 上述所有对角线模型都 
将 q 设定为 0。 对角线约束模型和对角线非约束模型只是社会距离模 型的一 
种。它们对社会流动过程的刻画主要在于流动所跨越的职业类别的个数。例 
如，在大多数对角线模型中，每跨越一个界限的流动都由相同的参数 ( d | k | 或 d k ) 
所决定。因此，同一个参数既适用于从下层体力职业阶层向上层体力职业阶层 
的流动，也适用于从下层非体力职业阶层向上层非体力职业阶层的流动。 

这些过于简单的模型并不能较好地拟合美国的流动表数据。问题在于，流 


①原文为 Uii ， 应为作者的失误，此处已改正。——译者注 
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动过程有可能像 QD 模型所假设的那样复杂。另一方面，问题还可能在于，流动 
跨越了几个界限与流动跨越了哪些界限相比，其实并不那么重要。假定社会流 
动是一个人们在行进时不断清除障碍的过程，每清除一个障碍可能类似于跨出 
同样的一步。对角线模型要说明的是，不管你从哪里开始，第一步的跨度是 
do - d M 第二步的跨度是山一山，如此类推。相反，也可以假定每一步的跨度是 
由它所跨越的两个职业类别之间的距离所决定的。在基于这种假定的模型下， 
上层非体力职业阶层与下层非体力职业阶层之间的障碍跨度是一个值 ( Vl ) ，不 
管这是不是第一步，下层非体力职业阶层与上层体力职业阶层之间的障碍跨度 
则是另外一个值 ( v 2 )， 如此等等。根据这种算法，任意两个职业类别 i 和 j 之间 
的距离就是它们之间的障碍跨度值 之和： 

Qj = 2^ (当 i > j 时） 

s=j 

Cii = 2 Vs (当 i<j 时） 

S=j 

对 Qj 的这一定义与公式 3. 1相同。于是就有了下面的模型，即跨越参数 
模型 ( CP ): 

log ( Fij ) = ao + a H + a 2j + Qj [3. 9] 

上式适用于公式 2. 2。仍以从上层非体力职业阶层向下层非体力职业阶层和从 
下层非体力职业阶层向上层体力职业阶层的流动为例。根据 CP 模型，上层非 
体力职业阶层与上层体力职业阶层之间的距离就等于它们之间的障碍跨度值 
之和。设从上层非体力职业阶层向上层体力职业阶层流动的距离参数为 c 13 , 则 
有 Cl3 = Vl + V 2 。 CP 模型非常有意思，因为它能形象地展现这种二维空间里的 
距 离感。 由于连接任意两个职业类别 i 与 j 的参数等于连接该区间内相邻职业 
类别的参数之和，所以，所有的职业类别可以说排列在一条直线上。约翰逊 
( Johnson , 1980:123—130) 在美国婚姻配对研究中，将 CP 模型的这一思路进行 
了进一步的发挥。 

CP 模型的另一个有意思的特征在于，职业地位层级两端的继承性被归因 
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于阶层隔阂（即职业类别的这种划分），而不是其他模型所说的本来就存在的阶 
层继承性。也就是说， CP 模型精确地拟合了第(1， 1) 格与第 ( R ， R ) 格。为了测 
量阶层隔阂所没有考虑到的第2类职业一直到第 （R — 1) 类职业的继承性是否 
显著，又会在 CP 模型的基础上进一步对参数进行约束，或者相反，不对参数进 
行约束。在约束形式 ( QCP - C ) 下，主对角线上所有的单元格都适用同一个表示 
继承性强度的参数山： 


log ( Fjj ) = ao + au + a 2 j + Cij + do [3. 10] 

上式适用公式 2. 2 和公式 3. 1。在非约束形式 （ QCP ) 下，对角线上的第二 
个单元格一直到第 （R — 1) 个单元格各自适用一个表示继承性强度的参 
数 doi : 


log ( Fij ) = ao + au + a2j + Qj + doi [3. 11] 

上式适用公式 2. 2,并且仅在2 < i < R — 1时 ， doi 才存在。哈伯曼 （ Haberman ， 
1979:519) 曾经给出了一个与此等价的模型，虽然在形式上有所不同。他对任 
意取值 i 下的 doi 都进行了定义，并通过约束 Vi = v 2 和 vrh = v R 来对 d Qi 进行区 
分。与前面所介绍的所有模型相比， CP 模型以及它的两个拓展形式在进行参 
数估计时会更复杂 ( Goodman ，1972 a ; Haberman ， 1979)。 

上述3个模型的统计结果见表 3. 3。表中的前三栏分别是 CP 模型、 QCP-C 
模型和 QCP 模型下的期望频数。第四栏报告了职业类别之间的距离参数 ( Cij ) 
(它由障碍跨度 v k K 决定），对角线以上的部分是在 CP 模型下得到的估计值，对 
角线以下的部分则是在 QCP 模型下得到的估计值①。在 0. 05的显著性水平 
上，这3个模型仍然无法拟合数据。不过，如果考虑到△值的变化，模型拟合优 
度的改进还是可以的。 CP 模型错误地划分了 2. 1%的个案， QCP 模型将这一比 
例降低到了 1.6%。但 QCP - C 模型则不怎么样——相对于 CP 模型而言，其拟 
合优度并没有提高，而且与 QCP 模型相比明显逊色许多。 


①注意，这段文字中的表述与表格中的内容并不吻合，应该是表格中漏掉了 QCP - C 模型下的期 
望频数这一栏。——译者注 
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表 3. 3父亲的职业与儿子的第一份职业之间的流动:3个跨越参数模型的估计结果 




职业获得 



职业出身 

上层非体力 下层非体力 

上层体力 

下层体力 

农民 

(1) CP 模型的期望频数 





上层非体力 

1414 

543. 70 

287. 60 

631. 54 

43. 16 

下层非体力 

664. 64 

580. 66 

307. 14 

674. 47 

46. 09 

上层体力 

781. 96 

704. 35 

776. 95 

1706. 14 

116. 59 

下层体力 

847. 10 

763. 02 

841. 67 

3324. 06 

227. 16 

农民 

413. 30 

372. 27 

410. 64 

1621.79 

1832 

(2) QCP-C 模型的期望频数 





上层非体力 
下层非体力 
上层体力 
下层体力 
农民 



缺 



(3) QCP 模型的期望频数 





上层非体力 

1414 

566. 36 

266. 26 

630. 27 

43. 10 

下层非体力 

678. 64 

524 

297. 64 

704. 54 

48. 18 

上层体力 

744. 00 

694. 09 

856 

1677. 20 

114.71 

下层体力 

849. 49 

792. 80 

809. 00 

3325 

227. 00 

农民 

414. 87 

387. 04 

395. 10 

1620. 99 

1832 

(4) 职业类别之间的 距离 : Qj 





(对角线以上为 CP 模型结果,对角线以下为 QCP 模型结果） 



上层非体力 

— 

0. 426 

0. 793 

1. 086 

2. 489 

下层非体力 

0. 423 

— 

0. 367 

0. 660 

2.063 

上层体力 

0. 811 

0. 388 

— 

0. 293 

1.696 

下层体力 

1. 086 

0. 663 

0. 275 

— 

1. 403 

农民 

(5) 参数估计值 

2. 488 

2.065 

1. 677 

1. 402 



跨越参数 


对角线参数 



1 2 

3 

4 2 

3 

4 

CP 

0. 426 

1.403 

0.367 

0. 293 — 

— 

— 

QCP-C 

0.417 

1. 392 

0. 365 

0. 283 0. 019 0. 019 

0. 019 

QCP 

0. 423 

1.402 

0. 388 

0. 275-0. 189 0.189 

0. 018 


L 2 

X 2 

df 

P 

△ 

CP 

89.91 

90. 95 

12 

<0.01 

0. 021 

QCP-C 

89. 48 

90. 65 

11 

<0.01 

0. 021 

QCP 

64. 24 

64. 67 

9 

<0.01 

0. 016 



需要特别注意的是， CP 模型和 QCP 模型的优势都在于使用了较少的 
参数。它们在建模时就考虑了上层非体力职业阶层和农民职业阶层所具有 
的高度继承性。它们之间仅有的实质性区别在于对下层非体力职业阶层和 
上层体力职业阶层的继承性有不同的考虑。 CP 模型对下层非体力职业阶 
层的继承性估计过高，且对上层体力职业阶层的继承性估计过低（请注意， 
与对角线模型不同，山2的取值在这里为负并不意味着不存在职业地位的继 
承性）。 

两个相邻职业阶层之间的距离的最大值出现在下层体力职业阶层与农民 
职业阶层之间，其次是在上层非体力职业阶层与下层非体力职业阶层之间。虽 
然下层非体力职业阶层与上层体力职业阶层之间的流动障碍要稍大于上层体 
力职业阶层与下层体力职业阶层之间的流动障碍，但两者的绝对值都并不 
太大。 


流动模型的 logit 形式 

对数线性模型的数学方程式并不一定非要用期望频数来表达。它同样可 
以用期望 logit 值(定义见下文)或期望优比来表达 ( Goodman ，1979 b )。 在 logit 
模型形式下，对流动模式的解释通常会更为直观。 logit 值就是具有某种相同职 
业岀身 （ i ) 的人进人一个较高地位的职业： i 相对于进入一个较低地位的职业 
(j + 1) 的发生比的对 数值： 


= log ( Fy / Fi , - &1 ) [3. 12] 

上式中的 X 代表职业出身， Y 代表职业获得。 

流动模型的 logit 形式比期望频数形式能够更清楚地说明职业出身对职业 

获得的影响。尽管 logit 模型形式的一般化方程表达经常因太过复杂而很难体 

% 

现这一点，但每一个单独的 logit 方程却能够很好地说明问题。更重要的是，对 
这些单独的 logit 模型的结果作图，通常有助于我们理解不同流动模型之间的差 
异。图 3. 2 就是利用 logit 值描绘了美国男性就业者第一份职业获得的模式。 
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1 2 3 4 5 

职业岀身 



职业岀身 

(b) 下层非 体力： 上层体力 


(a) 上层非 体力： 下层非体力 



职业出身 职业出身 


(c) 上层体力：下层体力 （d) 下层体力：农民 

图 3.2 QD 模型下的观测 logit 值(点)与期望 logit 值(线） 

其他一些相对简单的模型分别使用不同的方式使图 3. 2中的线变得较为平 
滑。最简单的模型是完全流动模型，在该模型下， logit 值的连线斜率为0。 
QPM 模型只涉及对角线效应，在该模型下， logit 值的连线呈锯齿状。边角模型 
虽说由对角线效应所产生的峰值所主导，但由于非对角线上的4个边角效应的 
影响，在其他地方也会出现一些倾斜。 QCP 模型不仅有对角线效应所造成的峰 
值，而且还有一个倾斜模式。这表明， logit 值对地位较高的职业获得比对地位 
较低的职业获得而言，更多地受到了职业岀身的影响。图 3. 3对照了 QCP 模型 
和 QPM 模型下的 logit 期望值。线是由 QCP 模型下所预期的 logit 值连接而 
成，点则表示 QPM 模型下预期的 logit 值。 


图中的点表示实际观察到的 logit 值，线则由 QD 模型下所预期的 logit 值连接 
而成。该图十分接近并验证了前面所描述的总体流动模式。 
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1 2 3 4 5 


- 0.4 




1 2 3 4 5 


职业岀身 职业出身 

( c ) 上层体力：下层体力 （ d ) 下层体力：农民 

图 3.3 QPM 模型下的期望 logit 值(点)与 QCP 模型下的期望 logit 值(线） 

在 QD 、 QPM 和 QCP 3 个模型中， QCP 最好地拟合了数据。因此，到目前 
为止，该模型下的 logit 值连线图最好地描绘了美国流动表数据中所存在的规律 
性。其实，模型设计还可以进一步优化，我现在就转向介绍那些与 QCP 模型一 
样拟合数据，甚至比它拟合得更好的模型。 


职业出身 

( a ) 上层非体力：下层非体力 


职业出身 

( b ) 下层非体力：上层体力 





■••••••••• 

IX IX IX 11 IX IX 

---- 二 I - 二 











第 4 章 I 拓扑模型 


豪斯（1978、1979； Featherman & Hauser, 1978:131 — 150) 重新设计了古 
德曼 (1972a) 的一般化模型，以进一步纳人跨行、跨列和跨对角线的参数约束。 
豪斯从公式 3. 1中的参数入手发展岀了拓扑模型，从而用流动表中的准独立单 
元格——或“层级”——区域来定义交互效应。在同一层级内，单元格之间是准 
独立的，也就是说，在同一个层级内，职业出身与职业获得之间是不相关的。同 
一层级内的每一个单元格上的交互效应都只用一个参数来概括(尽管每一个单 
元格的参数个数也可以超过一个， Duncan & Schuman , 1980)。同一层级内的 

所有单元格共享一个交互项参数，于是它们就构成了一个准独立区域。实际 
上，这个方法就是将模型中的某些参数值约束为相等，如同对角线模型和边角 
模型的处理手法那样。但与一般化的对角线模型不同，拓扑模型并不事先限定 
哪些单元格可以被纳入同一个层级。 

术语非常重要。本章所涉及的模型通常被称为“结构”模型。这一术语是 
豪斯 (1978) 采用的，目的是强调这些模型将普遍效应与交互效应相分离的特 
性。选择这一术语，同时也是参考了戈德伯格 (Gddberger，1973) 的研究，他将 
那些不管数据形式如何变化，取值总保持不变的参数称为“结构性的”。豪斯之 
所以使用这一术语，正是因为这些模型具有不管边缘效应参数怎么变，交互效 
应都不会变的特点。但是，交互效应参数的这种不变性是有条件的，这会在本 
章最后一节中加以讨论。拓扑学是几何学的一个分支，涉及的正是变形中的不 
变性。我将这些模型称做“拓扑”模型，正是要表明它们的不变性是有条件的。 

这种统计建模方法是由豪斯(1978、 1979) 引入的。他用以下文字来概括这 
一方法 （Hauser，1979:416): 
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全部单元格 ( i ， j ) 都被指定分属 K 个彼此之间完全互斥并已穷尽所有 
可能的子集，每一个子集共享一个相同的交互项参数 ( d k )。 因此，除了总体 
效应、行效应和列效应（即边缘效应）的影响之外，每一个期望频数仅仅由 
一个交互项参数决定，而这个参数就反映了单元格之间相对流动性或继承 
性的强度。模型的交互项参数直接与实际观察到的联合强度这一概念相 
对应 （ White ， 1963:26)，并且可以被解释为职业类别之间的社会距离指标。 
(比较 Rogoff ，1953:31—32) 

子集由一组单元格构成，在同一组单元格里，流动是自由的，即职业出身和 
职业获得是相互独立的，但这种自由流动或者相互独立是以边缘分布和单元格 
被指定分属 K 个层级为条件的。 


费瑟曼一豪斯模型 


费瑟曼和豪斯 (1978:150—159; Hauser , 1979) 针对表 1. 1中的数据提出 
了有5个层级(即 K = 5) 的拓扑模型。每个单元格被指定的层级序列如以下设 
计矩阵 所示： 

2 4 5 5 5 

3 4 5 5 5 

5 5 5 5 5 

5 5 5 4 4 

5 5 5 4 1 

上述矩阵中的数字代表 k 的取值。注意，层级序列数值从小到大排列，对应的 
强度(相对于边缘效应而言)则是从高到低变化，两者方向相反。1至5这些数 
值只不过是在模型参数估计出来以后才赋予的象征性的序列，模型本身并不约 
束交互项参数以这种整数形式 排列： 


logCFjj) = ao + au + a2j + dk 


[4. 1] 
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上式适用公式 2. 2。该公式只识别层级参数 d k 之间的差别。也就是说，知道了 
k 一 1个参数值，就可以推算出第 k 个参数值。因此，在估计层级参数之前，必须 
作出某些条件限定。这种模型识别方法带来的后果之一就是模型的自由度个 
数为 （R — I ) 2 — (K — 1) ，而并不是一般所认为的 （ R _ I ) 2 — K 。 公式 2. 3所体 
现的标准化方法解决了模型的识别问题，但它并非唯一可行的约束方法。拓扑 
模型所使用的标准化方法并非这种零和规一，而是约束某一项 d k 值为 0( 即某 
一个层级的参数并不需要计算），其他 d k 值所测量的正是偏离该基准层级的程 
度。在实践中，参数值被设定为0的层级就是由最多单元格所组成的子集。这 
一约束方法有利于比较那些在特定的子集中包含不同数量单元格的模型。而 
如果用公式 2. 3那样的约束条件，则每当某一子集 k 所纳入的单元格数目在模 
型之间发生变化时，4值也必然会随之改变，即使 d k 之间的差值(即 d k — d k ) 在 
模型之间并没有发生任何变化。零和规一方法的这种特性正是拓扑模型所采 
用的标准化方法(即设某一项4值为 0) 所要避免的。本章最后一节会对这一 
原则加以说明。 

K 个子集并没有用尽流动表中的准独立区域。在特定的条件下，即使一个 
2 X 2 分表中的单元格处于不同的层级，它也仍然能够显示出职业岀身与职业获 
得在期望频数分布上的不相关性。以单元格(1，2)，（1，3)，（2, 2)，（2, 3) 组 
成的这个2 X 2分表为例，它涉及了第四层级和第五层级，但它根据期望频数得 
到的优比值在取对数之后为0: 

012 = log(Fi2 F23 /F13 F23 ) 

= d 4 + d 5 — di — d 5 [4. 2] 


上述拓扑模型的结果见表 4. 1。表中所给出的期望频数就是期望频数本 
身，并非类似之前表格中的 F ，。 参数的估计值由 FREQ 软件直接给出，但也 
可由期望频数推算得到，其方法是要先得到不处于第五层级上的每 -- 个单元格 
在被假设处于第五层级情况下的期望频数 ( F 5,） ： 


4 
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d k = logCFjj / FSij *) [4. 3] 

F 5, 的计算原理与 * 相同。根据定义，只要某个优比涉及处于相同层级上的 
单元格的期望频数，它的值就总是等于1。为了得出某个单元格上的 F 5 4 j * 值， 
要先找到一个由不处于第五层级上的第 （ i ， j ) 格和另外3个处于第五层级上的 
单元格所构成的优比，例 如： 

F522 * = F32 F23 /F33 

或者是找到一个由某些处于第五层级上的单元格和某些 F 5 ii * 值已经获知的单 
元格所构成的优比。 


表 4. 1父亲的职业与儿子的第一份职业之间的流动:5层拓扑模型的估计结果 


职业出身 

上层非体力 

职业获得 

下层非体力 上层体力 

下层体力 

农民 

(1) 期望频数 

上层非体力 

1414 

515. 08 

297. 43 

649. 06 

44.41 

下层非体力 

724 

522. 95 

301.97 

658. 97 

45. 09 

上层体力 

754. 23 

740. 04 

777. 93 

1697. 62 

116. 16 

下层体力 

812. 27 

796. 98 

837. 79 

3328. 23 

227. 73 

农民 

396. 35 

388. 89 

408. 80 

1624. 01 

1832 

(2) 参数估计值 

上层非体力 

1. 590 

0. 599 

0 

0 

0 

下层非体力 

0. 905 

0. 599 

0 

0 

0 

上层体力 

0 

0 

0 

0 

0 

下层体力 

0 

0 

0 

0. 599 

0. 599 

农民 

0 

0 

0 

0. 599 

3. 402 

注： L 2 = 66. 57； X 2 : 

= 66. 50； df = 12； 

p < 0. 01； △ = 

0. 018。 




然而，参数估计结果表明，对角线模型下的参数值所描绘的流动和继承模 
式正好也被拓扑模型下的这些参数值所反映出来。反映农民职业阶层的继承 
性的参数值最大，反映上层非体力职业阶层的继承性的参数值次之，随后是从 
下层非体力职业阶层向上层非体力职业阶层的流动参数。在这 3 个参数层级 
中，第三层级是模型矩阵设计中唯-个不具有对称性的层级。费瑟曼和豪斯 
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(1978:152) 指 出：“ 这一不对称性是引人注意的，因为它表示上层白领阶层至少 
有能力避免某种形式的家庭地位衰落。”这一对称性或许也可以作为某 种证据 
被解读为，代际的向上流动在非体力职业阶层内部较为容易。如果第（1， 2) 格 
的强度——它表示的是上层非体力职业阶层后代的向下流动——异常地低，费 
瑟曼和豪斯的上述解读会更站得住脚，但数据显示并非如此。事实上，异常的 
强度值出现在第(2, 1) 格，这表明，其实是下层非体力职业阶层后代的向上流动 
性过高。 

流动表边角部分的其余5个单元格上的交互效应在前文的对角线模型和边 
角模型中被发现十分接近，在这里的拓扑模型中则被约束为完全相等。剩余的 
17个单元格都被标记为具有相对较低的强度(排除了边缘效应的影响之后），并 
且在这一大块表格区域(包括整个第三行与第三列上的单元格及其他层级为5 
的单元格）内具有准完全流动的特征，正如第四层级的5个单元格区域内以及第 
四层级与第五层级之间的流动模式。 

费瑟曼和豪斯的这一拓扑模型的拟合优度并不算好。事实上，边角模型、 
对角线模型以及几个对角线约束模型都具有更低的 L 2 和 X 2 值。但他们更中 
意这一模型，因为具有6个层级的候选模型并不能将拟合优度提高多少，而且也 
提不出具有实质意义的、有趣的单元格子集。尽管如此，为了便于说明，这里还 
是要探讨一下费瑟曼一豪斯模型的一些改动。在跟随后续的分析过程时，读者 
需注意，本书所使用的研究样本非常大 ( N = 19912)。因此，统计模型在能够探 
测出一些微小效应的同时，也会增加对模型本身的解释难度，毕竟当前的流动 
理论还有待提高。 

模型校正的原则 :拟合 与简约 

流动模型与其他对数线性模型一样，在进行模型选择时，描述性(或拟合优 
度)和简约性(或自由度)都是很重要的。虽然用完了所有自由度的饱和模型必 
然会完全复原观测频数的分布，但这种模型描述与简单地考察观测频数的做法 
相比，并无任何高明之处。正是因为这种简约性与描述性之间的权衡，“一个简 
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单的模型通常比一个较复杂的模型更受青睐，即使后者对数据的拟合 更好” 
( Fienberg ， 1980:56)。 关键在于，以损失拟合优度来换取自由度的做法究竟在 
多大程度上可以被接受？ 

模型选择有赖于 L 2 统计量所具有的可叠加 性：自 由度分别为和 df 2 的 
两个 L 2 统计量之间的差值服从自由度为 dh - df 2 的卡方分布。在对数线性模 
型分析中，当一个模型蕴含了另一个模型时，或者说当一个模型对另一个模型 
的一个或多个参数进行某种约束时，上述原则就适用。约束的形式多种多样， 
最常见的是零值约束和等值约束。零值约束是将某对数线性模型的一个或多 
个参数值设定为 0 ;等值约束是将某对数线性模型中的某些参数值设定为相等。 
如果没有理论约定，上述原则就不能被用于模型选择。过度拟合、互相参照和 
不确定结果等问题，都会使纯粹依赖统计技术的模型选择过程变得不可行 
( Fienberg , 1980:56—68)。但即使这些问题真的存在，上述原则仍然提供了有 

用的指导，而且，它仍然可以被当做模型选择的辅助手段，虽然它不再是可靠且 
简便的模型选择依据。 

费瑟曼一豪斯模型蕴含了边角模型和 QD 模型，因为将后两个模型中的某 
些参数值约束为 0 或约束为相等就可以得到它。而且，边角模型也包含了 QD 
模型。回顾前面的章节就会发现，在屏蔽了边角模型没有加以特别考虑的4个 

单元格-第(2, 3) 格、第(3, 2) 格、第(3, 4) 格和第( 4 , 3 ) 格——之后，就得到 

了 QD 模型。这也就是说，边角模型是 QD 模型的一个特例，是将后者中的 4 个 
参数(即 A 3 、 us 2 、 UK 、 U 43 ) 都约束为 0 。进一步将边角模型中的一个参数约束 
为 0 , 5个参数约束为相等，就得到了费瑟曼一豪斯模型： 

d 33 = 0 

di2 = d 2 2 = d 4 4 = CI45 = d 54 = d 4 

请注意，零值约束和等值约束之间的区别有时并不那么确定，因为它是由参数 
识别的具体标准化方法所决定的。在费瑟曼一豪斯模型的对数形式中，参数的 

设定可以写成 d 5 = 0 , = 如此一来，零值约束其实就变成了等值 约束： 

di 3 = di 4 = di 5 = ••• = d 53 = d 5 
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区别两个层级模型的每一个自由度都存在一个约束。因此，两个层级模型之间 
的区别就可以被分解为 （dh - df 2 ) 个单独检验，每一个检验都有一个自由度。 
通过加入那些并不显著减小拟合优度的约束条件以及排除那些显著减小拟合 
优度的约束条件(所谓的显著是在一些常用的显著性水平上而言，如 0. 05)，模 
型就可以被校正。非常重要的一点是，刚才提到的显著性水平并不是对找到零 
假设下 L 2 值这一概率的准确估计，因为在大多数情况下，零假设都是被选来使 
L 2 值最大化的。这是典型的过度拟合问题，应该在实践中注意避免。在真实的 
研究情境下，这里所进行的某些检验可以被用来获得一个可以接受的模型，但 
是，在进行数量相等的检验之后，用说明性的概率水平来反映真实的概率水平 
却是一个不好的习惯。 

表 4. 2说明了上述的模型选择过程。 QD 模型处于起始位置。连续加入4 
个约束条件之后， QD 模型就变成了边角模型。首先，参数 ii 43 被设定为0,紧接 
着，参数 u 34 也被设定为0,随后依次轮到参数 u 32 和参数 u 23 。这4个约束中的3 
个都显著地降低了 L 2 。 在边角模型的对角线参数约束中，唯一在统计意义上不 
重要的是对参数 u 34 的约束。 

表 4. 2所显示的这些约束条件被加入模型中的次序并不是非此不可的。加 
入次序可达24种之多 (4! =24)。更重要的是，并不能保证两种不同的加入次 
序会得出相同的结果。这种情形类似于逐步回归结果的不确定性。因此，约束 
条件被引入模型的次序会对结果产生影响 ( Goodman ，1972 c )。 下文会讲到，对 
第( 3 , 3) 格的处理方法取决于对第(3, 3) 格进行参数约束时是将哪个模型作为 
基准模型，这正好说明了这一点。 

要从边角模型转变到费瑟曼一豪斯模型，有5个约束条件是必需的。 
表4 2从唯一的零值约束屯= 0入手。将这一约束条件加入边角模型后， L 2 值 
增加了 IS . ( M ( 见表格下半部分以 C 5 开头的那一行），这表明，参数屯具有统计显 
著性(即它的值不等于0)。其余的4个约束条件针对费瑟曼一豪斯模型中共同构 
成第四层级的5个单元格。它们中没有一个能显著地提升 L 2 值(见以 C 6 至 C 9 
开头的几行)。因此，从对角线模型向费瑟曼一豪斯模型过渡所加入的诸多约束 
条件中，有些是相当重要的，有些则不那么重要。重要的部分是约束第(4, 3) 格、 
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第(3, 2) 格、第(3, 3) 格、第(3, 4) 格第五层级的一部分。在对角线模型和费瑟 
曼一豪斯模型之间 51. 03的 L 2 值差异中，这些约束解释了其中的 49. 45%。 


表 4. 2父亲的职业与儿子的第一份职业之间的 流动: 
连接对角线模型和5层拓扑模型的一系列层级模型 



Ml 

对角线模型 

15. 54 

15. 48 

3 

<0.01 

0. 006 

M2 

山 3 = 0 

23. 08 

22. 79 

4 

<0.01 

0. 007 

M3 

山 4 = 0 

23.25 

22. 98 

5 

<0.01 

0. 007 

M4 

d 3 2 = 0 

43.80 

44. 12 

6 

<0.01 

0. 012 

M5 

^23 — 0( 边角模型） 

50. 12 

50. 44 

7 

<0.01 

0. 014 

M6 

d33 = 0 

65. 16 

65.31 

8 

<0.01 

0.017 

M7 

di2 = d22 = 山 

65. 20 

65.38 

9 

<0.01 

0. 017 

M8 

(I44 == 山 

65. 39 

65. 45 

10 

<0.01 

0.017 

M9 

山 5 = 山 

66.22 

66. 27 

11 

<0.01 

0.017 

M10 

d 54 =4(5 层拓扑模型） 

66. 57 

66. 50 

12 

<0.01 

0. 018 

Mil 

山 3 = 山 

52.10 

52.21 

11 

<0.01 

0. 015 

Ml 2 

山 2 = d23 = d? 

33.21 

33. 14 

10 

<0.01 

0. 012 

M13 

CI34 = 山 3 = 山 

21. 16 

20. 90 

9 

0.01 

0. 009 

Ml 4 

^23 = <^32 = CI34 = d}3 = d7 

29. 90 

29. 69 

10 

<0.01 

0. 013 

Ml 5 

<^23 = ^32 == de » 

d 34 = CI43 = d 7 ; d 3 3 = 0 

21. 56 

21. 30 

10 

0. 02 

0. 009 

M16 

023 == CI32 ； (I34 — d43 

20.78 

20. 50 

8 

0.01 

0. 009 

模型比较 






Cl 

M1-M2 

7. 54 

7.31 

1 

<0.01 


C2 

M2-M3 

0. 17 

0. 19 

1 

>0. 50 


C3 

M3-M4 

20. 55 

21. 14 

1 

<0.01 


C4 

M5-M4 

6. 32 

6. 32 

1 

<0.01 


C5 

M6-M5 

15. 04 

14. 87 

1 

<0.01 


C6 

M7-M6 

0. 04 

0. 07 

1 

>0. 50 


C7 

M8-M7 

0. 19 

0. 07 

1 

>0. 50 


C8 

M9-M8 

0. 83 

0. 82 

1 

>0. 50 


C9 

M10-M9 

0. 35 

0. 23 

1 

>0. 50 


CIO 

M10-M11 

14. 47 

14. 29 

1 

<0.01 


Cll 

M11-M12 

18.89 

19.07 

1 

<0.01 


C12 

M12-M13 

12.05 

12. 24 

1 

<0.01 


C13 

M14-M13 

8. 74 

8. 79 

1 

<0. 01 


C14 

M15-M13 

0. 40 

0. 40 

1 

>0. 50 


C15 

M15-M16 

0. 78 

0. 80 

1 

>0.50 



这一信息可以被用于提高费瑟曼一豪斯模型的拟合优度。然而需要注意， 
过度拟合的危险此时就变得相当严重了。豪斯 （1979:452 — 426) 虽然认为模型 
拟合优度的提升可能就在于这些单元格，但却出于对过度拟合问题的考虑而没 
有真正继续下去。在这里，我首先放松的是将第（3, 3) 格指定为第五层级这一 
约束，具体方法就是精确地拟合该单元格(也就是将该单元格上的参数层级设 
定为6)，这样就得到了模型 Mil 。 它与费瑟曼一豪斯模型相比有显著的改进 
(见以 CIO 幵头的那一行）。接下来，我再放松将第（2, 3) 格和第（3, 2) 格指定 
为第五层级这一约束，并加入一个新的层级(第七层级)来指定这两个单元格。 
正如以 C 11 开头的那一行所显示，这一改变显著地减少了 L 2 值。最后，第 
( 3 , 4) 格与第(4, 3) 格也被从第五层级中分离出来。前面已经讲到， u 34 = 0这 
一 约束条件并不能显著地改变 L 2 值，但沿袭费瑟曼和豪斯对模型简约性的偏 
好，第(3, 4) 格与第(4, 3) 格被同时引入最后这个约束条件，并且它们是否可以 
被约束为处于相同层级这一问题也已进行了检验(见以 C 15 开头的那一行）。 
对第(3, 4) 格与第(4, 3) 格加入第八个层级之后，就得到了模型 M 13, 它与模型 
M 12 相比有显著的改进(见 C 12 开头的那一行）。第七层级与第八层级不能被 
合并为一个相同的层级(合并得到的模型是 M 14)， 正如以 C 13 开头的那一行所 
显示。然而，既然围绕次对角线的单元格现在都已被排除在第五层级之外，那 
么第(3, 3) 格就可以被恢复为第五层级了（见模型 M 15) ，正如以 C 14 开头的那 
一行所显示的。注意，模型 M 15 与 M 13 而非 M 14 之间存在层级关系。最后一 
步是检验第七层级和第八层级的对称性。两个检验是分别进行的，但表中只给 
出了合并后的结果。若将这两个约束条件加在一起， L 2 值会减少 0. 78( 见以 
C 15 开头的那一行）。 

模型 M 15 的结果见表 4. 3。将表中的参数估计值与 QD 模型下的参数估计 
值(见表 3. 2) 比较一下可以发现，两个模型所揭示的流动模式几乎相同。模型 
M 15 优于 QD 模型之处在于它更简约，它清理了 QD 模型中差别不大的几个参 
数(模型 M 15 中有6个等值约束），并删去了一个并不重要的参数 ( d 33 )。 与费瑟 
曼一豪斯模型的假设相比，模型 M 15 揭示岀了更少的跨越体力/非体力界限的 
流动 ( d 7 = — 0.248)。这一点其实在 QD 模型中也已经显示出来了，但对角线 
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模型并没有清楚地表明，这种跨越体力/非体力界限的流动的缺乏在两个相反 
的方向上(即向上流动和向下流动）是等量的。流动性的缺乏还出现在上层体 
力职业阶层与下层体力职业阶层之间，但在量上有所改善。当然，模型 M15 的 
p 值 (0.02) 小于常用的显著性水平。如果加入新的层级参数，模型的拟合优度 
或许还可以再提高。但这种做法并不可取。因为，此时数据中的随机误差被放 
大的可能性已经很大了。 


表 4.3 父亲的职业与儿子的第一份职业之间的流动:7层拓扑模型 ( M 15) 的估计结果 


职业出身 

上层非体力 

职业获得 

下层非体力 上层体力 

下层体力 

农民 

(1) 期望频数 

上层非体力 

1414 

508. 60 

301. 38 

652. 96 

43. 06 

下层非体力 

724 

540. 12 

249. 73 

693. 42 

45. 73 

上层体力 

781. 79 

652. 27 

865. 35 

1662. 95 

123. 64 

下层体力 

798. 60 

853. 92 

784. 05 

3345. 78 

220. 65 

农民 

382. 59 

409. 09 

423. 48 

1602. 86 

1832 

(2) 参数估计值 

上层非体力 

1. 647 

0. 558 

0 

0 

0 

下层非体力 

0. 918 

0. 558 

一 0. 248 

0 

0 

上层体力 

0 

-0. 248 

0 

— 0. 120 

0 

下层体力 

0 

0 

_ 0. 120 

0. 558 

0. 558 

农民 

0 

0 

0 

0. 558 

3.410 


注： L 2 = 21. 56; X 2 = 21. 30； df = 10； p < 0. 02; A = 0. 009。 


如果我没有发现跨越体力/非体力界限的流动性较弱这一有趣的现象，我 
的确会倾向于费瑟曼和豪斯关于 5 个层级的拓扑模型就足够了的说法。但我现 
在当然不会同意，尤其是当我注意到，费瑟曼和豪斯 （ 1978: 166— 172) 关于父代 
职业与子代现职的流动分析结果也同样显示岀跨越体力/非体力界限的向下流 
动(但并不包括相应的向上流动)有所缺乏。 7 层拓扑模型表明， 社会中 层岀身 
的男性的流动机会比费瑟曼和豪斯 (1978:178) 的 5 层拓扑模型所预期的要少。 

5 层拓扑模型和由此延伸得到的 7 层拓扑模型的 logit 形式结果见图 4. 1。 
图中的点代表 5 层模型的期望 logit 值，线则连接了 7 层模型的期望 logit 值。 
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( c ) 上层体力：下层体力 （ d ) 下层体力 ：农民 

图 4. 1 5层拓扑模型下的期望 logit 值(点)与7层拓扑模型下的期望 logit 值(线） 

拓扑模型的不确定性 

大多数对数线性模型都有一种以上的写法。利用古德曼 （1972 a ) 提供的 
公式，能够得到本书到目前为止所介绍的大部分模型的等价方程式。某一模 
型的等价方程式通常在意义解释上也是等价的，但却并非总是如此。试想一 
下彭蒂宁 （1981) 提出的基于费瑟曼一豪斯5层模型（本节中简称为 FH 5) 的 

两种 变形： 


职业出身 

( a ) 上层非 体力： 下层非体力 


职业出身 

( b ) 下层非体力：上层体力 


这些图清楚地展现了 7层模型如何优于5层模型。请留意图 4. 1中5层拓扑丰旲 
型的 logit 值与图 3. 3中准跨越参数模型的 logit 值之间的相似性。这一现象是 
由彭蒂宁 ( Pontinen ，1981) 发现并指出的。至于这种相似性因何产生，又会造 

成何种结果是下一节我们要讨论的主题。 




6789012345 

ow nu IX IX 11 11 11 1i 
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2 4 4 5 5 2 4 5 5 5 

3 4 4 5 5 3 4 5 5 5 

5 5 4 5 5 4 4 4 4 4 

5 5 4 4 4 5 5 5 4 4 

5 5 4 4 1 5 5 5 4 1 

PI P 2 

将 FH 5 中整个第三列上的单元格从第五层级改为第四层级，就得到 P1 。 同样， 
将 FH 5 中整个第三行上的单元格从第五层级改为第四层级，就得到 P2 。 FH5 、 
P 1 和 P 2 看似不同，但其实相同。 3 个模型的期望频数分布完全相同。 

FH 5、 P1 和 P2 之间的差异意味着对它们的解释也不同。 FH5 的一个重要 
特征是，第五层级所涉及的流动表区域不仅广阔而且具有对称性。费瑟 曼和豪 

斯 (1978: 151— 153) 在解释 FH 5 时，对这两个特征都做了强调。 FH 5 所具有的 

广阔对称性并非某种巧合。费瑟曼和豪斯其实是特意挑选了这一具有最大程 

度对称性的模型 （Featherman & Hauser , 1978： 150—176； Hauser , 1978、 

1979、1981)。 这种对称性对于他们拒绝布劳和邓肯 （1 967:58 一 67) 的相关结论 

来说显得尤其重要，后者曾总结道，具有不完全可渗透性的阶层界限在允许从 

体力职业阶层到非体力职业阶层以及从农民职业阶层到体力职业阶层这种向 

上流动的同时，也阻碍了跨越这些阶层界限的向下流动。 P1 和 P2 包含了 FH 5 

的部分对称结构，但却并不包含这一关键的对称特征，即发生于上层体力职业 

阶层与下层非体力职业阶层之间的双向流动（即向上流动与向下 流动) 具有对 

称性。在 P1 中，从下层非体力职业阶层到上层体力职业阶层的向下流动多于 

反向的向上流动。在 P2 中，跨越体力/非体力界限的向上流动多于相应的向下 

流动?而这恰好与布劳和邓肯的上述结论相一致。因此，不能将 FH 5 对表 1. 1 

流动表数据的拟合用来检验布劳和邓肯关于阶层界限具有不完全可渗透性这 

一结论，原因在于，与布劳和邓肯这一结论相等价的模型其实本来就有饽于 
FH 5 的对称特性。 

FH 5、 P1 和 P2 之间的关系，可以由表 4. 4所报告的参数估计值反映岀来。 



流动表分析 


127 


最引人注意的是，3个模型的交互项参数彼此完全相同。此外，边缘效应也十分 
接近。 FH 5 与 P 1 的行边缘参数完全相同， FH 5 与 P 2 的列边缘参数完全相同。 
FH 5 与 P 1 之间只有第三列的边缘参数不同， FH 5 与 P 2 之间只有第三行的边 
缘参数不同。 P 2 第三行的参数值比 FH 5 和 P 1 的相应参数值小 0. 509, P 1 第 
三列的参数值比 FH 5 和 P 1 的相应参数值也小 0. 5的，而第四层级上的交互效 
应参数也是0.599,这并非巧合。虽然彭蒂宁 （1981:6) 经过一系列相当复杂的 
运算之后才得到了 P 1 (和 P 2)， 但这一运算过程其实就相当于向第三列（对 P 2 
而言是第三行)加入第四层级上的参数，然后再与那一列(对 P 2 而言是行）的边 
缘效应相减。期望频数的对数值(以及期望 logit 值和优比值)不会发生任何改 
变，因为加到交互效应上的值又被从列(或行)边缘效应中减去了。 

P 1 和 P 2 还不是仅有的两个能够得到与 FH 5 相同的期望频数的模型变形。 
麦克唐纳 ( Macdonald ，1981) 就提出了这样一个拓扑 模型： 


Ml 

Ml 是从 P 1 得到的，方法是将第一列的层级参数减去 0. 99(即01 1 —山），并将3 21 
加上0.99。表 4.4 也给出了 Ml 的参数估计值(注意，这些参数值是相对于第三 
层级而言的），这样就可以将其与 FH 5、 P 1 和 P 2 进行比较。这种形式（而非 
Macdonald 所用的形式)的比较突出了从 P 1 得到 Ml 或从 FH 5 得到 Ml 的运 

算方法。 

这些结果确实带来了麻烦，但还不至于麻烦到像麦克唐纳 （1981) 所说的拓 
扑模型应该被舍弃的程度。这些结果强调了研究者必须小心、恰当地解释拓扑 
模型的参数结果。值得注意的是， FH 5、 PI 、 P 2 和 Ml 这4个等价模型中的3 
个，在相同列单元格上的层级参数差异并不受模型变形的影响。同样，其中两 
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表 4. 4父亲的职业与儿子的第一份职业之间的 流动: 
各种5层拓扑模型的参数估计值比较 


效应 


FH 5 

P 1 

P 2 

Ml 

CP # 

行效应 

1 

_ 0. 318 

-0. 318 

-0. 318 

一 0. 318 

0.315 


2 

_ 0. 303 

一 0. 303 

— 0. 303 

_ 0. 303 

0. 119 


3 

0. 643 

0. 643 

0. 044 

0. 643 

-0. 432 


4 

0. 718 

0. 718 

0. 718 

0. 718 

-0. 904 

列效应 

1 

1. 872 

1.872 

1. 872 

2. 862 

0. 965 


2 

1. 853 

1. 853 

1. 853 

1.853 

0. 451 


3 

1. 903 

1. 304 

1. 903 

1.304 

0.201 


4 

2. 683 

2. 683 

2. 683 

2. 683 

1. 281 

交互效应 

1 

3. 403 

3. 403 

3. 403 

3. 403 

0. 495 


2 

1. 590 

1. 590 

1.590 

0. 599 

0. 300 


3 

0. 905 

0. 905 

0. 905 

— 

0. 300 


4 

0. 599 

0. 599 

0. 599 

一 0. 086 

1. 402 


5 


-- 

— 

一 0. 989 

0. 306 


个模型在相同行单元格上的层级参数差异也不受模型变形的影响。 


尽管上述4个等价模型都意味着相同的观测频数分布，但它们的实质含义 
还是可以并且确实不同的。这并不意味着对数线性模型不适合用来分析流动 
表数据，也不意味着研究者有理由无视那些能够表明某个模型优于另一个模型 
的证据。豪斯 (1981) 注意到，研究者在用结构方程模型来分析协方差矩阵时所 
面临的选择性问题与这种情形十分相似。例如，某研究者可能对高中学生的成 
就动机与学习成绩之间的关系感兴趣。 一 旦这种相关关系成立，就可以提岀4 
种模 型：可 能是动机决定成就，可能是成就决定 动机; 动机和成就可能相互决 
定，动机和成就之间也可能是由测量误差所引起的伪相关。 4 种模型意味着同 
样的协方差矩阵，但我们仍然承认对它们进行继续分析的重要性，并必须决定 
究竟选择哪种模型。所以，这与对数线性模型下的情形是相同的。 

拟合优度不能被用来区别上述4个模型。由于这些模型能够得到相同的期 
望频数分布，所以它们的拟合优度也是相同的。但是，拟合优度并非模型选择 
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的唯一准则。豪斯 (1981) 将流动模型是否具有对称性作为另一个可取的准则， 
他表明 ， PH 5 所包含的对称性结构不仅是必需的，而且能充分体现美国流动表 
数据偏离准对称模型(见第2章有关对称相关的部分)这一理想模型的程度。 

流动模型或许还可以在重复研究过程中加以区别。当进行历时比较、跨国 
比较或不同亚群体之间的比较时，等价模型会体现出差异性。例如，假定 Pi “ 真 
实地”描述了从父代职业向子代第一份职业的流动情况。如果在 P 1 中，第四层 
级与第五层级之间的流动障碍缩减为 0( 即 第四层级中所有单元格上的交互效 
应都减少 0. 599)， 将只有 P 1 能以最简单的参数改动反映这种变化 ，即只 需改动 
一个交互项参数。所有其他模型都会涉及外在边缘参数的变化以及交互项参 
数的一些变化(后一种情况是对 Ml 而言）。按照简约性的要求，应该选定这种 
参数最少发生变动的模型。因此，在上述假定情形下，我们会选择 P 1 作为最优 
模型。当然，真实情形下的重复研究结果并不一定能像刚才的假定情形 那样清 
楚。但是，历时比较、跨国比较和不同亚群体之间的比较仍然可 以为模 型选择 

提供重要的线索。第 5 章关于等价模型的部分会再举例说明如何使用跨国比较 
的研究结果来进行模型选择。 

在进人其他主题之前，关于模型的等价性还要最后补充一点，即拓扑模型 
与其他模型之间也可能存在等价性。彭蒂宁就发展出了这样一个非常有意思 
的模型，姑且称之为“跨越参数改动 模型” ，它与 FH 5 是等价的。该模型将第二 
个和第三个跨越参数约束为相等 ( v 2 = v 3 )， 并且特别为第(2, 1) 格引进了一个 
参数。该模型(简写为 CP * ) 的参数估计结果见表 4 . 4中的最后一列。表中所 
给出的第一到第四个交互项参数就是前四个 Vi 的估计值，第五个交互项参数则 
是第(2, 1) 格的参数估计值。这一结果与其他等价模型的结果大相径庭。首 
先，拓扑模型与跨越参数模型所强调的实际流动过程 不同。 拓扑模型更具有不 
连续性，它关注的是没有排序、不被约束的交互项参数的聚类。跨越模型关注 
的则是阶层隔阂，它取决于职业的分类排序和公式 3. 11中的约束条件。两类模 
型都强调了短距离流动多于长距离流动的事实，但即使在这一点上，它们仍有 
所不同。即使流动表数据中存在过多的长距离流动，拓扑模型应该也能够轻易 
地拟合数据，但跨越模型却只能拟合存在过多短距离流动的数据。 



第 5 章 I 尺度相关模型 




流动表分析与社会经济地位获得研究一样，探讨的理论议题都在于代际效 
应(例如， Blau & Duncan, 1967； Featherman &- Hauser, 1978)。 但是，豪斯 
(1978) 和其他研究者 （Pullum， 1975：2； Duncan, 1979) 都注意到，这两个研究 
传统泾渭分明，明显地表现在它们数据利用方式的不同。从本书前面的部分不 
难看岀，流动表分析的重点在于找到流动表所含不同分表中存在的或强或弱的 
关联模式。与此不同，社会经济地位获得研究着重的是社会出身与地位获得之 
间的因果关系的强度。这种差别可以从两个学派的方法论上反映岀来。应用 
于表格数据的对数线性模型满足了流动表分析对所有单元格进行逐一审视的 
要求，而一般线性模型更好地适用于地位获得研究所釆用的多变量分析路径。 

在度量职业特性这一议题上，地位获得研究与流动表分析之间也有所区 
别。大多数的流动表分析都很少对测量尺度作出某些假定(尽管有一些模型确 
实也会对职业类别之间的排列次序作出假定）。对地位获得研究而言，选择一 
个合适的测量尺度则非常必要，因为它关注的正是在同样的职业声望、地位或 
权威尺度上，父代位置与子代位置之间所具有的关系。虽然邓肯（19?9)对这两 
种研究路径作出了某种调和，即先将西蒙 (Simon，1974) 的模型应用于流动表， 
随后再发展岀一个增加了约束条件的模型，但对这些模型进行扩展仍然是古德 
曼 （1979a) 的贡献。 

统一关联 

研究社会流动的地位获得模型假定社会出身与地位获得之间存在一种线 



流动表分析 


131 


性关系。这个模型认为，社会出身每增加一个单位值，地位获得就会相应地增 
加某个单位值(再加上或减去一个服从正态分布的误差项）。假定这一模型是 
正确的，再进一步假定地位尺度被均分为 R 个间隔，根据这一尺度测量的社会 
岀身和地位获得在进行交叉分类后得到的 RXR 表中，第一行/第一列 （i = 1 ; 
j = 1 ) 代表最高地位，第 R 行/第 R 列 （i = R ; j = R )代表最低地位。在上述 
条件下，给定出身类别 i 时，个体获得某一地位类别 ( j ) 相对于获得稍低一级地 
位类别 （j + 1) 的发生 比为： 

^ij = log(Fij/Fi, m ) 

' = a 2 j — a 2 , j+i + bi [5. 1] 

上式适用于公式 2. 2, b 是一个统一关联参数(在特定条件下等于回归系数）。 
统一关联与回归之间的相似性如图 5. 1所示，该图给岀了美国流动表数据的实 
际 logit 值以及用统一关联模型进行拟合之后所得到的期望 l 0 gi t 值(实际 logit 
值用点表示，期望 logit 值用线表示）。 



图 5. 1统一关联模型下的观测 logit 值(点）与期望 logit 值(线) 


请注意，用统一关联模型得到的 logit 值与社会出身变量之间具有线性关 
系，即每当社会出身增加一个单位值，它也增加一个固定的单位值。这些直线 
是平行的，斜率 ( b ) 都为 0. 269。统一关联与回归之间还有其他方面的相似性 
( Haberman , 1979：396； Logan , 1983)，但这超出了本章的范围，恕不赘述。统 

一关联模型对美国流动表数据的拟合并不好。有关如何提高其拟合优度的方 
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法，会在介绍完该模型的几种数学表达方式之后再讨论，但图 5 . 1 已经明显反映 
出继承性是最大的问题所在。 

在统一关联模型下，期望频数服从下述公式： 

log ( Fij ) = ao + aij + a 2j + bij [5. 2] 

上式适用于公式 2. 2。统一关联模型这一命名来自它所预期的对数优比值，具 
有如下 模式： 


0 ij = log ( Fij Fh-1 , rfl / Fh-1 , j Fi , j+l ) 

=b [5. 3] 

也就是说，社会出身与地位获得之间的相关性在构成流动表的每一个 2 X 2 基本 
单元分表中都是相同的。统一关联模型是哈伯曼（19了4)的线性乘线性交互模 
型的一'种特殊形式： 

log ( Fij ) = ao + a H + a 2 j + bXiXj [5. 4] 

X 和 Xj 分别表示行变量和列变量各个类别的度量得分。令线性乘线性交互模 
型中的 X 和 Xj 相同并等于一组间距相等的常数，就得到了统一关联模型。这 
一约束可以表达为： 

Xi = ( R + l )— i ， Xj = (R + l)-j [5. 5] 

根据社会经济地位的相对高低，职业类别在这里就被度量为从5到1。 


统一关联的一般化 

图 5. 1可以被用于诊断统一关联模型在拟合美国流动表数据时所存在的问 
题。图中有4处可以校正，改动其中的任何一处或许就可以提高模型的拟合优 
度。第一，将 logit 值约束为一条直线可能过于 苛刻; 第二，每条线的斜率可能并 
不完全相同;第三，实际 logit 值与期望 logit 值出现最大偏差的地方在于代际继 
承发生时，这表明需要将对角线单元格进行特殊处理;最后，农民职业岀身的人 
的流动模式最为不同。古德曼 (1979 a ) 提岀了一个模型，分别针对上述3处进行 



流动表分析 


133 


模型校正。第四种模型校正方案更为直截了当，例如，将农民职业出身的人从 
样本中删除 （Blau & Duncan , 1967： 135)。 

行效应模型 （ Simon ， 1974； Duncan , 1979； Goodman , 1979 a ) 将获得一^种 
地位类别相对于获得另一种地位类别的 logit 值与社会岀身之间的关系表述为 
一个非线性函数，但约束这种关系对所有 logit 值来说都相同。换言之，行效应 
模型是指，社会岀身每改变一个类别，获得某一地位类别相对于获得稍低一级 
地位类别的发生比的对数值都改变(增加或减少)一个固定值，不管比较的是哪 
两个相邻的地位获得类别。行效应模型的 logit 形 式为： 

Oij = log(Fij/Fi, j+i) 

= ao 十 a 2 j — 3 . 2 , j - i-i + boXi + bii [5. 6] 

上式适用于公式 2. 2 和公式 5. 5,并且 b u = b 1R = 0。对 b u 和 b 1R 的这一约 
束是为了解决模型识别的问题 ( Goodman ，1979 a ) 0 其他形式的约束也是可行 
的 ( Clogg ，1982 b ) ，但我偏向于这一约束，因为 b 12 —直到\ R - i 的参数估计结果 
在解释时具有几何学上的意义。将％到 如 - m 连成一条线，并将其标注为 
ABj ，则 AB , 的斜率将会等于 k 。 b 12 到测量的是％到 如— w 这些参数值 
偏离 ABj 的程度。注意，虽然行效应模型允许期望的 logit 值偏离直线 A 马，但 
并不约束 ABj 之间是平行的，也不约束对 ABj 的偏离程度（即 bd 对所有的 j 来 
说是相同的。因此，连线上所有相邻两点之间是等距的。结果请见图 5. 2 U )。 

列效应模型 ( Goodman ，1979 a ) 放松了对斜率的对束，但保留了线性特征， 
正如图 5. 2( b ) 所示。这一模型包含了能够改变期望 logit 值连线的斜率的 
参数： 


^ij ~ ^2 j — 3 . 2 , j +1 + ( b 。 + b 2 j — b 2, j +1 )Xi [5. 7] 

/ 

上式适用于公式 2. 2 和公式 5. 5,并且 b 2 i = b 2R = 0。像行效应模型一样，岀于 
模型识别的原因，参数中的两个极值被设定为0。但在这里，采用这一约束的原 
因是为了对称性，而不是因为这些系数解释起来更为直观。 

行效应和列效应可以通过相加的方法结合起来，于是又得到了一个模型 
( Goodman 称之为“模型 I ”）。这一模型既允许对线性特征的偏离，也允许连接 
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1 2 3 4 5 

职业出身 

( b ) 列效应 



1 2 3 4 5 

职业出身 

( a ) 行效应 


1 2 3 4 5 

职业出身 

( c ) 行与列效应(模型 I ) 


lj 到 Ri 的连线 ABi 的斜率可变，线性偏离程度通过 bn(i 的取值从2到 R — 1) 来 
测量，斜率由 b 2j - b 2 , m ( j 的取值同样是从2到 R — 1) 这一差值来测量。行与 
列效应模型(模型 I ) 的数学表达 式为： 

^ij — a 2 j — a 2 , }+i + (b 0 + b 2 j — b 2 , j+i )Xi + bn [5. 8] 

上式适用于公式 2. 2 和公式 5. 5,并且 b u = b 1R = b 21 = b 2R = 0。图 5. 2( c ) 展示 
了用该模型来拟合美国流动表数据后所得到的期望 logit 值结果。 

有一种可能性很有意思，就是行效应与列效应相等，即 b lk = b 2k (i = k ， 
j = k ，2< k < R - l )。 这一模型在其他表格数据(例如，由丈夫职业和妻子职 
业构成的列联表)建模中的重要性比其在代际流动分析中的重要性更高 （ Hout , 
1982)。它就是大家知道的同质行与列效应模型(模型工 ）. 











图 5. 2各种关联模型下的期望 logit 值 
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模型 I 

古德曼 (1979 a ) 和克洛格 (1982 b 、1983) 从另一个不同的角度探讨了如何校 
正统一关联模型的参数约束。与关注引入非线性特征或斜率变化这种思路有 
所不同，他们设法分别或者同时对社会出身和地位获得进行尺度上的重新度 
量，以得岀线性乘线性交互参数，而这些参数则会形成一组平行直线。古德曼 
(1979 a ) 将公式 5. 8所表达的模型命名为“模型 I ”，并提出了它的一个替代模型 
(命名为“模型 n ”）: 


Oij = a 2j — a 2 , m + bui ( V 】 一 v m ) [5. 9] 

并且， 

2 u i = 2 v j = 0 

[5. 10] 

2 u f = 2 u j 2 = 1 


在这一模型中 ， Ui 是一组针对社会岀身变量的尺度调整参数，与之相应， ^ 是一 
组针对地位获得变量的尺度调整参数。这两组参数值都需要从数据中估计岀 
来。该模型是线性乘线性交互模型的一种形式，即将不同职业类别的地位得分 
作为需要估计的参数，而不是由理论或前人的研究结果来决定。如果各种职业 
类别的地位得分是未知的，那么，模型 n 会对这些得分进行估计，以得到能最佳 
拟合数据的线性乘线性交互效应。如果 Ui 和^被发现是均等间隔的(即对所有 
的 i 值来说，― um 总是等于某个常数，对所有的 j 值来说 ， Vj — 也都等于 
这个常数），模型 n 就等同于统一关联模型。如果只有 w 是均等间隔的，那么模 
型 II 就等同于列效应模型(公式 5.7); 如果只有 Vj 是均等间隔的，那么，模型 n 
就等同于行效应模型（公式 5 . 6)。用模型 n 拟合美国流动表数据的结果见 
图 5. 2( d )。 该图最明显的特征是 X 轴的尺度发生了变化，它反映的就是4。图 
中的线并不是平行的。参数 Vj 带来的尺度变化可以被应用于 ij ， 以使这些线相 
互平行。注意，模型 n 并不具有对数线性的特征，因为 b 、 Ui 、 Vi 都必须被估计 
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出来。至于估计方法具体如何，有兴趣的读者可以参考其他著作 （ Goodman ， 
1979 a ； Clogg , 1983)。 

模型 ii 可以将行效应和列效应约束为相等，与此类似，模型 n 也可以有这 
种同质效应形式。这种约束形式下的模型 n 具有特别重要的实际意义，因为它 
假定社会出身和地位获得的测量尺度具有一致性，即 Uk = Vk(i = k，j = k ， 
2< k < R —1)。 

到目前为止，我们尚未谈及自由度的问题。事实上，这些模型相当简约，它 
们没有耗费很多自由度就概括了社会出身与地位获得之间的相关模式。这种 
简约性在大表中表现得尤为明显(例如， Breiger ， 1981； Hout ， 待出）。统一关联 
模型是最简约的，它在拟合边缘分布之外只需再拟合一个参数。行效应模型和 
列效应模型都需要拟合除边缘分布以外的 R — 2个参数，两个同质行与列效应 
模型也是如此。模型 I 和模型 II 需要拟合的参数最多，有 2 (R — 2) 个，但尽管 
如此，它还是相当简约的。将拟合了边缘分布之后剩余的自由度个数 (R — I ) 2 
再减去独立参数的个数，就得到了各个模型的自 由度： 


模型 

自由度 

统一关联模型 

( R -1) 2 -! 

行效应模型 

( R -1 KR -2) 

列效应模型 

( R 一 1) ( R 一 2) 

行与列效应模型 （ I ) 

( R -2) 2 

同质行与列效应模型 （ I ) 

( R -1 XR -2) 

行与列效应模型 （ n ) 

( R -2) 2 

同质行与列效应模型 （ n ) 

( R -1 XR -2) 


对美国流动表数据中相关性的分析 


表 5. 1简要地给出了对美国流动表数据中相关性的分析结果。完全流动模 

型-零相关模型——也列在表中以进行比较。表中没有任何一个模型能够 

充分拟合数据，但这并不代表这些模型不能提供有用的信息。相反，它们用很 
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少的参数说明了表格中大部分的相关信息。当引入单一的统一关联参数时，模 
型的拟合优度得到了最大程度的提升。统一关联模型的 L 2 值比零相关模型的 
L 2 值减少了 2280. 69 0 行效应与列效应都能显著地提高模型的拟合优度，但行 
效应参数与列效应参数并不相等，正如同质行一列效应模型与异质行一列效应 
模型的 L 2 值之差所显示的那样。 


表 5. 1父亲的职业与儿子的第一份职业之间的 流动: 关联模型的估计结果 




职业获得 



职业岀身 

上层非体力 

下层非体力 

上层体力 

下层体力 

农民 

(1) UA 模型的期望频数 





上层非体力 

1407. 07 

647. 02 

320. 36 

483. 31 

62. 24 

下层非体力 

778. 96 

468. 87 

303. 89 

600. 12 

101. 16 

上层体力 

894. 95 

705. 14 

598. 23 

1546. 45 

341. 23 

下层体力 

734. 60 

757. 64 

841. 38 ' 

2847. 06 

822. 33 

农民 

285. 42 

385. 33 

560. 14 

2481. 07 

938. 05 

(2) 模型 I 的期望频数 





上层非体力 

1348. 01 

579. 03 

345. 33 

646. 21 

1. 42 

下层非体力 

746. 52 

437. 43 

319. 05 

742. 53 

7.47 

上层体力 

842. 18 

686. 74 

624. 92 

1845. 22 

86. 94 

下层体力 

864. 02 

864. 14 

864. 69 

2855. 13 

555. 02 

农民 

300. 26 

396. 67 

470. 01 

1868. 91 

1614. 14 

(3) 模型 II 的期望频数 





上层非体力 

1311.81 

564. 52 

331. 18 

708. 98 

3. 47 

下层非体力 

700. 94 

426. 31 

313. 36 

795. 50 

16.88 

上层体力 

862. 63 

695. 04 

613. 66 

1789. 46 

125. 21 

下层体力 

987. 70 

923. 79 

898. 88 

2821. 03 

371. 60 

农民 

237. 91 

354. 34 

466. 93 

1843. 04 

1747. 79 


L 2 

X 2 

df 

P 

△ 

零相关模型 

6170. 13 

7166. 77 

16 

<0.05 

0. 205 

统一关联模型 

2280. 69 

2220. 56 

15 

< 0. 05 

0. 120 

行效应模型 

2080. 17 

2042. 67 

12 

< 0. 05 

0. 123 

列效应模型 

903. 84 

1680. 36 

12 

<0. 05 

0. 069 

模型 I 

877. 81 

1824. 29 

9 

<0. 05 

0. 067 

模型 n 

685. 51 

990. 02 

9 

<0.05 

0. 065 

同质模型工 

1287. 89 

1343. 50 

12 

<0.05 

0. 089 

同质模型 n 

935. 87 

1056. 91 

12 

<0. 05 

0. 083 
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这些模型的参数估计值见表 5. 2。 由于模型对数据的拟合并不好，所以这 
些参数值并不具备太大的实质性意义，但这里还是可以谈谈对它们的理论解 
释。统一关联模型和行效应模型中的统一关联参数表示的是连接私和如』的 
直线的斜率。在列效应模型和模型I中，统一关联参数表示的是斜率的基准 
值，列效应会使斜率发生变化;在模型 n 中，统一关联参数表示的是在进行尺度 
调整之后连接^和恥啲直线的斜率。为了识别模型 n ，需要对它进行一些约 
束。表 5. 2 给出了两种标准化方法。模型 n (a) 采用的是前面讲过的方法(公式 
5. 10)。模型 n (b) 采用的方法是约束该模型下的统一关联参数等于统一关联 


表 5. 2父亲的职业与儿子的第一份职业之间的 流动: 
各种关联模型的参数估计值(括号内的数字为标准误) 


参数 

统一关 

行效应 

列效应 

行与列效应模型 

同质行与列效应模型 

联模型 

模型 

模型 

I 

n(a) 

n(b) 

I 

n(b) 

统一关 

联效应 

0. 269* 
(0. 005) 

0. 295* 

(0. 006) 

0. 525* 

(0.011) 

0. 534* 

(0. 011) 

4. 574 

0. 269 

0. 389* 

(0. 007) 

0. 269 

行效应 

1 


0 


0 

0. 642 

5 

0 

5 

2 


0. 064* 

(0. 020) 

• 

—0. 030 

(0. 021) 

0.271 

3. 469 

0. 032* 

(0. 005) 

3. 950 

3 

— 

0. 113* 

(0.016) 

< 

-0. 079* 

0.018 

— 0. 031 

2.225 

0. 155* 

(0. 009) 

3. 178 

4 

■ 

0. 221* 
(0.016) 


-0. 003 

0.017 

-0. 191 

1. 565 

0. 321* 

(0.011) 

2. 736 

5 

— 

0 

— 

0 

— 0. 691 

-0. 493 

0 

0.065 

列效应 

1 


一 

0 

0 

0. 456 

5 

0 

5 

2 

— 


0. 236* 
(0. 019) 

0. 253* 
(0. 021) 

0. 252 

4. 161 

0. 032* 

(0. 005) 

3. 950 

3 



0. 593* 

(0. 026) 

0. 615* 

(0. 029) 

0. 119 

3. 613 

0. 155* 

(0. 009) 

3. 178 

4 



0. 940* 

(0. 031) 

0. 960* 

(0. 035) 

0. 019 

3. 200 

0. 321* 

(0.011) 

2. 736 

5 

— 

— 

0 

0 

-0. 845 

— 0. 362 

0 

0. 065 


注: 对模型 n 无法计算标准误。 # 表示 p < o. 05。 
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模型下的统一关联参数，并且约束上层非体力职业阶层的行效应与列效应 
都等于 5. 0。后一种标准化方法强调将模型 n 理解为是对统一关联模型的 
测量尺度加以调整。行效应与列效应可以被解释为利用经验数据得出的行 
与列的尺度得分。如果这些行系数与列系数是事先已知的，它们就可以代 
替（5, 4, 3, 2, 1) 作为行与列的尺度得分。使用这些行与列的尺度得分来 
拟合线性乘线性交互模型，会得到与模型 n 同样的 L 2 值以及一个统一关联 
参数0.269。既然行与列上的职业分类相同，理想的做法就是对行与列使 
用同样的尺度得分，但如果不能显著地减少 L 2 , 就表明这种做法不妥，因为 
具有这种同质性约束的模型 II 并不能达到没有这种同质性约束的模型 ]] 的 
拟合优度。 

同质性的不成立，可能是由那些导致模型 n 拟合度不好的外在因素的干扰 
引起的。但如果模型能够拟合数据，并且行与列的尺度得分仍然不同，我们可 
以下结论说，不同职业之间的距离已经在代际之间发生了变化，或者说，职业分 
类体系的构成在父代与子代之间已经不再相同。就美国流动表数据而言，我会 
倾向于接受第二种结论，因为美国劳动力结构的重大变化确实已经导致了父代 
与子代在职业分布上的一系列差异，相信这种变化已经在使用宽泛的职业五分 
法的5 X 5流动表中体现出来了。 


删除对角线单元格后的相关性分析 


提高上述模型的拟合优度的方法仍然是像之前做过的那样 :从对 角线入 
手。正如其他对数线性模型，通过屏蔽某些特定的单元格或者对这些单元格拟 
合某些独特的参数(两者是等价的），就可以对本章所介绍的各种关联模型进行 
修正。以后一种方法为例，准统一关联模型的表达式为： 

屯 ij = a2j — a2, j+i + b 0 Xj + di (Zij — Z“ 汗 1 ) [5. 11] 

上式适用于公式 2. 2 和公式 5. 5, 并且， 
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Zij = 1 (i = j ) 

Zij =0 ( i ^ j ) 


[5. 12] 


对这一模型的解释与统一关联模型几乎相同。统一关联参数 （ bo ) 表示的是 
%到 0 Ri 连接线的斜率，它测量的是社会出身变量变化一个单位时，地位获得 
j 相对于地位获得 j + 1 的发生比增加多少个单位。然而，像行/列效应模型一 
样，并非所有的期望 logit 值都位于 化和 之间的连接线上。对角线效应参 
数使 logit 值在对角线附近上下移动（具体取决于 di 的符号以及 i = j 或 
i = j + l ) 0 

准行效应模型、准列效应模型、准模型 I 、准模型 n 以及准同质行与列效应 
模型可以用如下相似的表达式来 定义： 


— a 2 j — a 2 , j+i + b。Xi + bii + di (Zij _ Z“ 汗 1 ) 

— a 2 j — a 2 , j+i + ( b 0 + b 2 j)Xi + di (Zij — Z “ 出 ） 

% = a 2 j — a 2 , 汗 i + (bo + b 2 j )Xi + bu + dj (Zij — Z“ 出 ） 

Oij = a 2j — a 2 , h-i + bui (vjXvj+i) + di (Z;j — Z“ m ) 


[5. 13] 
[5. 14] 
[5. 15] 
[5. 16] 


以上公式都适用于公式 2. 2、公式 5. 5和公式 5. 12。在这些模型中，行效应参数 
( bu ) 和对角线效应参数 ( di ) 都会使 logit 值偏离从―到的连接线。列效应 
参数 ( b 2 j ) 则使这些连接线的斜率发生变化，正如在列效应模型和模型 I 中那 
样。图 5. 3给出了准统一关联模型、准行效应模型、准列效应模型以及准模型工 
在拟合美国流动表数据结果上的差别。 




( a ) 准统一关联 






流动表分析 



职业出身 职业出身 


( C ) 准列效应 （ d ) 准行与列效应 

图 5. 3含有对角线参数的关联模型下的期望 logit 值 


以删除对角线单元格后再建模这种思路为指导，可以得到许多不同的模 
型，并不仅仅包括上面所列举的这些。一些扩展形式的模型会在第6章中加以 
介绍。此外，也可以对上述一般化模型中的某些参数进行约束以得到新的模 
型。例如，公式 5. 15中的参数4可以被约束为一个常数 d 以适用所有的对角 
线单 元格; 对公式 5. 15的另一个约束是令两个行效应相等，例如， b 12 = b 14 。 限 
于篇幅，本书无法列出所有可能的约束形式，但参数约束这种方法在第6章将要 
介绍的模型的最新发展中会显得尤为重要。 

将上述模型应用于美国流动表数据后的拟合优度统计值见表 5. 3。模型 
的参数估计值见表 5. 4。拟合对角线单元格上的参数后，与表 5. 2中的相应 
模型相比较，大幅提升了模型的拟合优度。尽管所有这些模型在常用的显著 
性水平上都被拒绝了，但(屏蔽对角线单元格后的）行效应模型与模型 I 的拟 
合优度比前几节中的任何一个模型都好。列效应则看似并不重要。缺乏模型 
II 的估计结果，就无法对这一结论的正确性作岀严格的判断，但支持性的证 
据是模型 I 在行效应模型的基础上并没有显著的改进。因此，对美国流动表 
数据来说，准行效应模型看似是一个最好的模型。正如图 5. 3( b ) 所显示的那 
样，较强的对角线效应冲淡了行效应。这些对角线效应使获得某一职业地位 
相对于获得低一级职业地位的发生比在每一类社会岀身发生地位继承的地 
方岀现了峰值。然而，社会出身对地位获得所具有的正向主效应依然是存 
在的。 
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表 5. 3父亲的职业与儿子的第一份职业之间的 流动: 各种准关联模型的估计结果 


职业获得 


职业出身 

上层非体力 

下层非体力 

上层体力 

下层体力 

农民 

(1) 准统一关联模型的期望频数 





上层非体力 

1414 

529. 70 

299. 97 

641.01 

35. 33 

下层非体力 

638. 97 

524 

297. 39 

744. 57 

48.08 

上层体力 

841. 64 

691. 71 

856 

1577. 33 

119. 33 

下层体力 

861. 90 

829. 93 

755. 90 

3325 

230. 27 

农民 

344. 50 

388. 66 

414. 75 

1670. 10 

1832 

(2) 准模型 I 的期望频数 





上层非体力 

1414 

533. 87 

278. 30 

651. 80 

42.03 

下层非体力 

716. 37 

524 

271. 66 

698. 22 

42. 76 

上层体力 

790. 30 

661. 74 

856 

1665. 56 

112. 39 

下层体力 

794. 30 

835. 04 

812. 84 

3325 

235. 82 

农民 

386. 03 

409. 35 

405. 21 

1617.41 

1832 

(3) 准同质模型 I 的期望频数 





上层非体力 

1414 

570. 64 

282. 41 

612. 53 

40.41 

下层非体力 

678. 75 

524 

276. 66 

724. 94 

48. 66 

上层体力 

791.25 

651. 67 

856 

1669. 72 

117.36 

下层体力 

825. 97 

821. 84 

803. 62 

3325 

226. 57 

农民 

391. 03 

395. 84 

405. 31 

1625. 82 

1832 


V 

X 2 

df 

P 

△ 


准完全流动模型 

683. 34 

720. 74 

11 

<0.01 

0. 055 

准统一关联模型 

73.01 

73.45 

10 

<0.01 

0. 020 

准行效应模型 

34. 91 

35. 08 

7 

<0.01 

0.011 

准列效应模型 

66. 69 

67.81 

7 

<0.01 

0.018 

准模型 I 

27.75 

27. 77 

4 

<0.01 

0. 010 

准模型 n 

24. 11 

23.78 

4 

<0.01 

0.013 

准同质模型 I 

39. 51 

39. 57 

7 

<0.01 

0.013 

准同质模型 n 

39.28 

39. 24 

7 

<0.01 

0.013 
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表 5.4 父亲的职业与儿子的第一份职业之间的流动： 
各种准关联模型的参数估计值(括号内的数字为标准误) 


参数 

准统一 

准行效 

准列效 

准行与列效应模型 

准同质行与列效应模型 

关联模型应模型 

应模型 

I 

n ( a ) 

n ( b ) 

I 

n ( b ) 

统一关 

0. 158* 

0. 141* 

0. 165* 

0. 109* 

1. 621 

0. 158 

0. 118* 

0. 158 

联效应 

(0. 006) 

(0. 008) 

(0.014) 

(0. 009) 

(0. 015) 

行效应 









1 

— 

0 

— 

0 

0. 680 

5 

0 

5 

2 


0. 061* 

(0. 030) 


0. 040 

(0. 044) 

0. 325 

3. 863 

-0. 035 

(0. 038) 

3. 513 

3 


-0. 053* 

(0. 022) 


-0. 068* 
(0. 028) 

— 0. 083 

2. 560 

—0. 100* 

(0.025) 

2.401 

4 


—0. 100* 

(0. 027) 


0. 144* 

(0.035) 

— 0. 470 

1. 320 

-0. 136* 

(0. 033) 

1.313 

5 

— 

0 

— 

0 

— 0. 452 

1. 379 

0 

1. 193 

列效应 









1 

— 

— 

0 

0 

0. 748 

5 

0 

5 

2 


— 

— 0. 036 

(0. 027) 

— 0. 044 

(0. 040) 

0. 207 

3. 269 

_ 0. 035 

(0. 038) 

3. 513 

3 


■ 

—0. 048 

(0. 033) 

-0. 095* 

(0. 038) 

-0. 070 

2.383 

-0. 100* 

(0.025) 

2. 401 

4 

— 

— 

—0. 002 

(0. 041) 

—0. 120* 

(0. 050) 

-0. 410 

1. 297 

-0. 136* 

(0. 033) 

1. 313 

5 

— 

— 

0 

0 

-0. 475 

1.089 

0 

1. 193 

对角线 









1 

0. 469* 

(0. 054) 

0. 503* 

(0.081) 

0. 378* 

(0. 072) 

0. 424* 

(0. 158) 

0.086 

0. 086 

0. 308* 

(0. 155) 

0. 060 

2 

0. 156* 

(0. 055) 

0. 108 

(0.058) 

0.188* 0.125 

(0.061 X (0. 082) 

0. 275 

0. 275 

0. 135 

(0. 164) 

0. 246 

3 

0. 464* 

(0. 047) 

0. 490* 

(0. 048) 

0. 482* 

(0. 048) 

0. 520* 
(0. 050) 

0. 527 

0. 527 

0.812* 

(0. 098) 

0. 518 

4 

0. 247* 

(0. 035) 

0. 100 

(0.055) 

0. 256* 
(0. 036) 

0.014 

(0. 070) 

—0. 000 

—0. 000 

0. 049 

(0. 067) 

0. 043 

5 

2. 357* 

(0. 061) 

2. 573* 
(0. 079) 

2. 358* 
(0. 110) 

2. 911* 
(0.164) 

2. 785 

2. 785 

2. 910* 

(0.140) 

2. 763 


注: 对模型 n 无法计算标准误。•表示 p < o . 05 。 




不同模型之间的参数相似性 

留意一下表 5. 4 中准行效应模型下对角线参数的估计值。 d 3 与 d ! 的值相 
差不远，并且都显著地大于 d 2 或山。而回顾前文， d 3 在边角模型和对角线模型 
中都比较小，在费瑟曼一豪斯模型中甚至不显著。这种反差是由定义参数 d 3 时 
所对照的基准不同造成的。在边角模型、对角线模型和费瑟曼一豪斯模型中， 
基准是准完全流动模型。对角线效应的测量是相对于其他交互效应存在时，调 
整后的边缘效应而言的 （ Pontinen ， 1981)。但在（准)行效应模型中，基准是描 
述社会出身对地位获得的影响作用的曲线。该曲线反映了交互效应，边缘效应 
只是改变了曲线的截距。尽管如此，这4个模型下的期望频数却甚少变化。其 
中3个模型在第三个对角线单元格上所得到的期望频数完全相同，即使是在费 
瑟曼一豪斯模型这一例外情况下，误差也不过小于10%。 

以边缘效应还是交互效应为基准，其本质差别在对4个模型进行实际解释 
时体现得十分清楚。边角模型、对角线模型和费瑟曼一豪斯模型表明，对于非 
出身于下层体力职业阶层和农民职业阶层的人来说，他们获得下层体力职业的 
情形相对较少，更多地是获得上层体力职业。并且，获得非体力职业的情形对 
非体力职业阶层出身的人来说特别普遍。获得上层体力职业的发生比在上层 
体力职业阶层出身的人中最高，因为在特殊参数的作用下，其他阶层岀身的人 
都被推向较高或较低的职业地位。根据行效应模型，获得较高职业地位的发生 
比随社会出身类别的上升而呈曲线模式增加。当应用于美国流动表数据时就 
意味着，当社会出身类别从下层体力职业上升到上层体力职业时，获得上层体 
力职业相对于获得下层体力职业的发生比只增加了一个很小的值。准行效应 
模型通过引入参数在改变了这一曲线模式。 d 3 的估计值之所以比较大，是因为 
上层体力职业阶层岀身的人获得上层体力职业的发生比实际上比行效应本身 
所预期的要大得多。 

上面两段文字体现了两点。第一，要正确地解释某个参数，研究者就必须 
理解参数计算所对照的基准是什么。第二，不能指望从模型的期望频数来洞悉 
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社会流动的过程与结构。任何模型的实质含义都在于参数的设定说明和参数 
的估计值。这一点使我们又回到了对等价形式的拓扑模型的讨论(见第4章有 
关拓扑模型的不确定性那一节）。下面的例子对前述讨论进行了更详细的说 
明，这其实是在邓肯 （1978) 的说明 （Duncan 8^ Schuman, 1980) 上所做的某种 

改动。 


再论等价模型 


试想一下3 X 3流动表的两个模型。第一个模型是 QPM ; 第二个模型包括 
一个统一关联参数 ( b )、 一个同质行一列参数 ( c ) 和一个适用全部3个对角线单 
元格的参数 ( d )， 这里姑且称之为“对角线行一列模型” ( DRC )。 这两个模型的 
期望频数分 别为： 


logCFij) = ao + an + a 2 j + di Zij [5. 17] 

log(Fij) = a。+ a。+ a2j + bXiXj + c(Xi + Xj) + dZij [5. 18] 

以上两式都适用于公式 2. 2、公式 5. 5和公式 5. 12。两个模型都有3个参数和 
一个自由度。更重要的是，两个模型的期望频数是完全一样的 (Duncan， 1978)。 
正因为如此，其中一个模型的参数可以表达为另一个模型的参数的 函数： 


QPM 为 DRC 的函数 

dj = d + 2(b — c) 

d 2 = d — b 


DRC 为 QPM 的函数 
b = (di — 2d 2 +d 3 )/6 
c = (d 3 — di )/4 


5. 19: 


d 3 =d + 2(b + c) d = (di +4d 2 +d 3 )/6 


这两个模型只在统计意义上具有等价性。就实际意义而言，它们是不同的。 
QPM 假定不同职业类别之间在继承性强度上的不同以及在移动者中，社会岀 
身和地位获得之间的独立性。 DRC 则假定所有职业类别的继承性强度是相同 
的，并假定社会出身对获得较高职业地位的发生比的影响呈曲线模式。为区分 
这两个模型，必须借助于第 4 章讨论过的一系列原则，包括对称性、简约性和可 
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重复性等。但在这里，对称性原则和简约性原则发挥不了作用，因为两个模型 
都具有对称性结构，也都有3个交互项参数，所以只能依赖于可重复性这一 
原则。 


英国和丹麦的流动比较 


学者经常分析的英国和丹麦的 3 X 3 流动表，在这里可以被用来体现何为 
可重复性。数据直接来自古德曼 （1965: 572) 的著作，但原始数据请见格拉斯 
(1954) 和斯瓦拉斯托加 （ Svalastoga ，1959) 的著作。职业类别被简单地划分为 
上层、中层和下层，具体的编码细则见古德曼 （1965) 的著作。这两个流动表被 
视为一个三维列联表(三维指的是社会岀身、地位获得、国家）。克洛格 （1982 a ) 
的方法被用于对 DRC 模型中的参数 b 、 c 、 d 进行跨国家约束，古德曼 （1969 b ) 
的方法被用于对 QPM 的参数进行跨国家约束。 

分析集中于 DRC 模型。最开始是对任何一个模型都不进行跨国家约束。 
随后， DRC 的参数 b 被约束为在英国和丹麦两个国家之间相等。最后，再依次 
分别将参数 c 和参数 d 约束为在两个国家之间相等。这4个模型依次被命名为 
模型 U 、 模型 B 、 模型 C 、 模型 D 。 公式 5. 19表达的 DRC 各参数之间的关系意味 
着，如果模型 D 被接受为最优模型，则参数 di 在国家之间一定相等。但是，如果 
模型 B 或模型 C 被接受为最优模型，则公式 5. 19并不能表明跨国家约束是成 
立还是不成立。事实上，如果模型 B 或模型 C 为真，则英国流动模型中的4值 
就不可能等于丹麦流动模型中的4值。因此，如果模型 B 或模型 C 被选中为 
DRC 模型的具体形式，它一定比相应的 QPM 模型的具体形式更简约， DRC 与 
QPM 之间孰优孰劣就一目了然。运用同样的逻辑，如果3个在参数中只有一 
个或两个可以被约束为在国家之间相等，那么， QPM 就比 DRC 更简约。 

上述模型的比较结果见表 5. 5。正如古德曼在对两国数据所作出的最初分 
析中指岀的， QPM 对数据的拟合非常好，但不可避免地， DRC 也同样如此。将 
参数 b 、 c 、 d 约束为在英国和丹麦两国之间相等后，模型的拟合优度并没有显著 
下降。这3个约束条件加在一起，只不过使 L 2 值增加了 2. 67 (df = 3, p > 0. 5)。 
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这种结果并不能使我们在 QPM 和 DRC 之间作出选择。于是就存在两种 结论: 
其一，存在一个大体上陡峭但在某些地方有所缓和的斜率 (b = 0. 581)。该斜率 
指的是，社会岀身每上升一个类别时，获得较高职业地位的发生比的增加值， 
“某些地方”是指当社会岀身类别从下层上升为中层时，存在一个对所有的职业 
类别而言强度都适中的继承性。其二，存在一种准完全流动模式，它在职业序 
列的两端有较高的继承性，但在中间则具有较高的“非继承性”。导致非继承性 
现象的原因有很多，但我认为，这一过程并不容易发生。此外，它在更大的流动 
表中也并没有出现。就英国和丹麦这两个国家的流动表数据而言，我更倾向于 
DRC 模型，因为它的参数值更合理。 

表 5. 5流动表的跨国比较结果 



模型 U 

模型 B 

模型 C 

模型 D 


英国 

丹麦 

英国 

丹麦 

英国 丹麦 

英国 . 

丹麦 

(1) 拟合优度 







L 2 

1.44 

1. 67 

2. 19 

4. 11 


X 2 

1.44 

1. 

67 

2. 19 

4. 10 


df 

2 


3 


4 

5 


△ 

0. 005 

0. 005 

0. 006 

0.010 

(2) DRC 模型的参数 






b 

0. 563 

0. 599 

0. 578 

0. 578 

0. 578 0. 578 

0. 581 

0. 581 

C 

-0. 099 

-0. 134 

-0. 099 

_ 0. 135 

一 0. 113 — 0. 113 

— 0. 115 — 

-0. 115 

d 

0. 175 

0.218 

0. 164 

0. 235 

0. 164 0. 240 

0. 191 

0. 191 

(3) QPM 模型的参数 






dl 

1. 501 

1. 684 

1.519 

1. 660 

1. 545 1. 621 

1. 583 

1. 583 

d 2 

—0. 388 

-0. 380 

-0.413 

-0. 343 

— 0. 414 —0. 338 

― 0. 390 — 

-0. 390 

d 3 

1. 103 

1. 147 

1. 122 

1. 122 

1. 094 1. 169 

1. 122 

1. 122 

(4) 对数优比的期望值 






( 011 ) 

1. 113 

1. 304 

1. 105 

1. 317 

1. 131 1. 283 

1. 193 

1. 193 

(012 ) 

0. 388 

0. 380 

0. 413 

0. 343 

0. 414 0. 338 

0. 390 

0. 390 

(021 ) 

0. 388 

0. 380 

0.413 

0. 343 

0. 414 0. 338 

0. 390 

0. 390 

(022 ) 

0. 715 

0. 766 

0. 709 

0. 779 

0. 680 0. 832 

0. 732 

0. 732 


邓肯(19 7 9:801)的结论用在这里甚为 恰当: 
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模型 (4)( 即准统一关联模型）对比较研究特别具有吸引力，为进行这 
种比较，它会非常严格地检验一个假设，即反映行与列交互效应的唯一的 
模型参数在两个及两个以上的研究总体之间是相等的，或者假设该参数随 
时间和研究的总体变化符合研究者所期望和指定的某种数学函数。 


本章已经显示了各种关联模型在概括和比较不同社会流动结构上的能力。 



第 6 章 I 新的发展 


前面所介绍的模型都可直接应用于流动表数据，但近来最有意思的研究是 
对这些基本模型作出进一步的发挥。本章将回顾克洛格（1981)、布里格 （1981) 
和豪特最近的论文。由于每篇论文都展示了一个独特的模型，所以它们不可能 
被一起讨论。但它们都探讨的几个共同的议题值得先行说明，以免这些普遍性 
的要点被论文的细节所淹没。山口 （Yamaguchi，1983) 和洛根 (Logan, 1983) 也 

讨论了许多这样的议题，但限于篇幅，在此无法对他们的论文进行详细介绍。 

第一个议题是关于适合的汇总层次。布里格、山口和豪特分析了来自 OCG 
的 17X17 流动表数据。其他人分析的是较小的流动表。在汇总层次这个议题 
之下就是职业类别的合并问题。布里格和古德曼 (1981) 讨论了合并时的准则。 

第二个议题是如何处理对角线。大多数研究者都沿袭已经为大家所接受 
的做法，即删除对角线单元格或者对它们进行精确的拟合(两者是等同的）。克 
洛格通过区分潜在的移动者和滞留者群体来说明对角线上的代际地位持续性。 
豪特通过引人独立变量来明确地为对角线进行建模，以说明代际继承的模式。 

第三个议题是在分析中引入独立变量。山口、洛根和豪特对此都有论述。 
山口和豪特比较了亚群体之间的流动模式;洛根将独立变量对流动结构的影响 
用公式进行了正式的描述。 

第四个议题涉及职业类别的度量。大多数研究者都使用如公式 5. 5那样的 
统一间隔尺度，或者只是它的某种变形。豪特使用邓肯 （1961) 的 SEI 均值来对 
职业类别进行赋值。 

第五，豪特和山口提岀了其他维度(而非地位维度)流动的可能性。 

最后，布里格和克洛格考虑了流动的阶级隔阂议题。尽管他们的研究路径 
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相当不同，但都致力于寻找潜在的社会阶级结构。布里格将阶级定义为某些职 
业类别的集合，但克洛格视阶级为一个嵌入的维度（它根据职业的本质区别进 
行划分），他对阶级的标准分类体系更感兴趣。这6个议题即贯穿最近的流动研 
究文献的主题。 


潜在的流动结构 


与本章所要讨论的其他模型相比，克洛格的模型显然与前面所介绍的基本 
模型关系不大。但正如克洛格自己指岀的， QPM 、 边角模型、 FH 5 以及其他几 
个基本模型都可以用潜在结构模型来表达。具体而言，这又包括一个标准潜在 
结构模型 （Lazarsfeld & Henry , 1968； Goodman , 1974； Haberman , 1979： 

541 — 552) 和一个全新的准潜在结构模型。潜在结构分析的基本论调是，一个 
或多个未被观测到的变量解释了已被观测到的变量之间的相关关系。在社会 
流动分析的情境下，它等于说明了社会岀身与地位获得之间其实是相互独立 
的，只不过它们都与某个未被观测到的变量存在相关性而已。克洛格对于发现 
一个或多个潜在变量来解释英国和丹麦流动表数据中社会岀身与地位获得之 
间的关系十分感兴趣。在本节中，我将美国流动表数据也加入进来进行比较。 

我用％表示流动表中第 ( i ， j ) 格的期望频数比例，即 h / N ， 其中，巧由某 
个模型所决定(模型的具体形式尚不确定）。用 t 表示未被观测到的第三个变量 
( Z ) 的分类，|表示在未被观测到的三维列联表中，第 ( i ， j ， t ) 单元格的期望频数 
比例。那么，观测频数比例(％)就等于 Z 取各个类别时的|相加 之和： 


^ij = [6. 1] 

t 

基本的潜在结构模型可以用潜在变量的边缘分布 （ Ttf ) 以及当一个随机潜在类 
别 t 对应社会出身类别 Ktt ^ 2 ) 和地位获得类别 j (^ Z ) 时的条件概率来 表达： 


XYZ' — Z XZ YZ 
TTjjt 7T t 7Tit TTjt 


[ 6 . 2 ] 


将公式 6.2 代入公式 6. 1，就得到了“潜在结构分析的基本方程式” （ Clogg ， 
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1981：839)： 


叫 = [6.3] 

请留意，该模型并没有像其他模型那样，将边缘效应与交互效应进行区分。 
观测到的边缘效应与交互效应都被看做只是反映了潜在的分布结构与交互关系。 
研究总体被假设为沿着各个潜在类别分布(在本例中有5个潜在类别)。假定某一 
个体属于某一潜在类别，则在5个可能的社会岀身类别@与5个可能的地位获得 
类别中任取一种组合的概率是固定的。观测到的交互模型只不过反映了潜在的 
边缘分布与条件概率而已。注意，这正是潜在结构模型的一个问题 所在: 尽管可 
以通过拟合观测到的边缘分布来确定潜在类别，但模型的参数并不一定将边缘效 
应与交互效应进行区分。观测到的边缘分布是由两个原因引 起的: 一个是潜在的 
边缘分布，一个是潜在变量与观测变量之间的交互关系。 

克洛格为 5 X 5 英国/丹麦流动表和 8 X 8 英国流动表设想了许多模型。他 
为 5 X 5 流动表选中的模型包含 5 个潜在类别。前两个类别是潜在的上层阶级 
与潜在的下层阶级。前者通过当 i = 5 和 t = 1时，约束= 0 来定义，即将社 
会出身类别最低的人从潜在类别1中排除 出去; 后者通过当 i = 1②和 t = 2 
时，约束0来定义，即将社会岀身类别最高的人从潜在类别2中排除出去。 
其他 3 个潜在类别分别由职业类别1、职业类别 3 和职业类别 5 中的潜在“滞留 
者”构成。它们分别通过当 i = j = 1和 t = 3 时约束1，当 i = j = 3 
和 t = 4时约束 t ^= 7 i ^ z= 1，当 i = j = 5 和 t = 5 时约束 71^ = 7 ^ z = 1 来 
定义。 

该模型的结果见表 6. 1。从中可见，它大致拟合了英国流动表数据，很好地 
拟合了丹麦流动表数据，但却不能像其他模型那样较好地拟合美国流动表数 
据。成为潜在的上层阶级成员的发生比在英国为 0.318(0.220/0.691 = 
0.318)， 比在丹麦的 （0. 251/0. 624 = 0.402) 大约低了 20%，比在美国的 


① 原文为“4个可能的社会出身类别”，应为作者的失误，此处已改正。——译者注 

② 原文为 “j = 1”，应为作者的失误，此处已改正。 —— 译者注 
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(0. 296/0. 567 - 0. 522) 大约低了 40%。上层阶级成员具有上层非体力职业 
岀身或获得上层非体力职业地位的条件概率在美国比在其他两个国家高岀 
许多。我们尚不清楚这些差别到底反映的是3个社会在分层过程上的实质性 
不同，或只是时期上的不同（在两个欧洲国家开展的研究比在美国进行的研 
究要早20多年），又或者只是编码上的不同。不管是哪一种原因，条件概率的 
这种差异都反映了实际观察到的边缘分布的差异。但至于它是否也反映了交 
互效应模式的差异，则不得而知了。下层阶级的条件分布在国家之间的差别 
并不大。 


表 6.1 父亲的职业与儿子的现职(英国和丹麦)或第一份职业（美国）之间的流动: 

包括5个潜在类别的模型结果 


取值 

人数比例 
(给定潜类 t ) 

( Ttf ) 

社会岀身类别为 i 的 
条件概率(给定潜类 t ) 

(巧） （#) 

职业获得类别为 j 的 
条件概率(给定潜类 t ) 

(#) (#) 

(1) 英国 

1 

0. 220 

0. 111 

0 

0. 077 

0. 000 

2 

0. 691 

0. 509 

0. 043 

0. 438 

0. 063 

3 

0.012 

0. 178 

0. 137 

0. 165 

0. 117 

4 

0.014 

0. 202 

0. 560 

0. 254 

0. 510 

5 

0. 062 

0 

0. 260 

0. 067 

0. 310 

(2) 丹麦 

1 

0. 251 

0. 071 

0 

0. 084 

0. 010 

2 

0. 624 

0. 450 

0. 032 

0. 383 

0. 022 

3 

0. 006 

0. 342 

0. 242 

0. 375 

0. 195 

4 

0. 059 

0. 137 

0. 466 

0. 125 

0. 505 

5 

0. 059 

0 

0. 260 

0. 032 

0. 269 

(3) 美国 

1 

0. 296 

0. 378 

0 

0. 342 

0. 129 

2 

0. 567 

0. 348 

0. 018 

0. 233 

0. 141 

3 

0. 031 

0. 249 

0. 199 

0. 122 

0. 136 

4 

0. 019 

0. 015 

0. 524 

0. 285 

0. 556 

5 

0. 086 

0 

0. 260 

0. 018 

0. 039 


注 : 取 值表示 Tlf 中 t 的取值、 Tcf 和 # 中 i 的取值以及 # 和 # 中 j 的取值。 
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从流动模式推论阶级结构 


布里格 （1981) 提岀了一个模型，不仅可以将一个大的 （17 X 17) 流动表的 
职业分类经过合并得到数量较少的类别集合，还可以同时对这些类别集合之 
间的交互参数进行估计。借用韦伯对阶级的定义，即阶级表示“其内部的个 
体或代际流动较易发生并且具有某种典型性” （ Breiger ， 1981: 579) ，布里格将 
社会阶级定义为某些职业类别的集合，在某一阶级所对应的职业流动分表 
中，职业获得与职业出身之间必须是相互独立的。这一模型的建立步骤如 
下：（1)将流动表中的 R 个职业类别划割为 C 个阶级。将这种划割方法同时 
应用于 RXR 表的行与列，得到 C 2 个分表。 （2) 对不包含对角线单元格的分 
表拟合完全流动 模型； 对包含对角线单元格的分表拟合准完全流动模型。将 
每一个分表模型的 L 2 和自由度相加，以检验职业岀身与职业获得在“阶级”内 
部相互独立这一零假设。 （3) 如果不能拒绝上述零假设，就将每一个分表中 
的频数相加，得到一个 C X C 表。然后再用第5章所介绍的模型来拟合这个 
CXC 表。 

布里格尝试了相关研究文献所提议的好几种划割方法，但最终只选择了一 
个八阶级划割法，并将其应用于从 OCG - II 得到的父代职业与子代第一份职业 
之间的17 X 17流动表(该流动表是表 1. 1的一个细化版本）。这8个阶级对图 
1.1 中17个职业类别的合并方式如下：（1)，（2, 3, 4)，（5)，（6, 7)，（9, 10)， 
(8, 13, 14)，（11，12, 15)，（16, 17) 0 

为检验这一划割方法是否适当，我们根据步骤 （2) 来分别拟合独立模型和 
准完全流动模型。八阶级划割法本来可能产生64个检验，但由于布里格令其中 
的几个阶级只包含一个或两个职业类别，所以造成了 31个检验的自由度为0。 
这些无法检验的分表包括了 30. 2%的样本量。剩余的33个检验的 L 2 值和自 
由度见表 6. 2。根据布里格 （1981:595) 的报告，这些 L 2 值相加之和为 76. 9,自 
由度相加之和为69。拟合结果是好的 （ p > 0. 20)。隐含的187个参数解释了 
17 X 17 流动表中大部分的相关关系。 
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表 6.2 父亲的职业与儿子的第一份职业之间的 流动: 布里格模型中33个检验的 L 2 值 





布里格的阶级分类 




阶级 

I 

n 

ID IV 

V 

YI 

1 

1 

I 

— 

— 

- - 

— 

— 

— 

— 

n 


1. 88* 

2. 02 

1. 80 

5. 33 

8. 94 

M 

1.86 


(1) 

(2) 

(4) 

(2) 

(4) 

(1) 

m 

w 

— 

4. 78 

— 

0. 55 

0. 05 

0. 05 

1. 40 


(2) 


(2) 

(1) 

(2) 

(1) 

V 


0. 99 

1. 98 

0. 04 

1. 09 

0. 62 

8. 68** 


(4) 

(2) 

(1) 

(2) 

(4) 

(2) 

VI 


0. 47 

0. 90 

0.22 


8. 74** 

0. 70 


(2) 

(1) 

(2) 


(2) 

(1) 

1 


6. 18 

2. 47 

4.21 

1. 79 

0.27 

0. 43 


(4) 

(2) 

(4) 

(2) 

(1) 

(2) 

1 


0. 94 

0. 32 

0. 22 

3. 13 

1. 56 



(2) 

(1) 

(2) 

(1) 

(2) 



注： ** 表示括号中的数字是自由度。"表示 P < 0. 05。 


表 6. 3 给出了步骤 (3) 的结果——分析职业类别被重新划割后所得到的流 
动表中的相关关系。邓肯 (1979) 和古德曼 （1979 a ) 所考虑过的模 型没有一个可 
以拟合数据。布里格对准行效应模型进行了改动，具体方法是屏蔽农民职业阶 
层这一行上的 3 个单元格，即那些出身于农民职业阶层但成为阶级 IV 、 阶级 V 和 
阶级 V [成员的人，结果对数据的拟合相当好。图 6. 1 展示了该模型的期望发生 
比。对角线效应占据了主导性的地位，在非对角线区域，几乎见不到社会出身 
对地位获得的影响。 

有证据表明，布里格的模型可能在很大程度上掩盖了非对角线区域所存在 
的重要交互关系，即美国流动表数据中父亲的职业对儿子第一份职业的影响。 
其中一些证据涉及（职业的)地位、自主性和培训模型 （ SAT ) 的应用，这将在下 
文中予以介绍。另外一些证据则涉及布里格在将单元格进行合并以生成新的 
“阶级流动表”时所采用的准则是否一定正确。别忘了，在用来检验合并方法 
是否恰当的分表中，有将近一半因为自由度为0而没有派上用场。因此，古德曼 





职业出身 

( a ) 有产的专业 人士： 受雇的中产阶级 



职业岀身 

( c ) 小业主：程式化的白领工人 



职业出身 

( e ) 半自主的技术工人：制造业工人 




职业出身 

( g ) 传统的工人 阶级： 农业阶级 

图 6.1 布里格模型下的期望 logit 值 
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表 6.3 父亲的职业与儿子的第一份职业之间的流动 ：布里 格的分析结果 





阶级获得 



阶级岀身 

I 

n in 

W 

V 

W 1 « 

(1) M6 模型的期望 频数： 




I 

25 

129. 02 1. 85 

48. 94 

15. 86 

23. 52 19. 26 1. 56 

n 

31.66 

1222 13. 85 

460. 04 

186. 95 

347. 88 357. 32 36. 29 

in 

12.35 

311.44 33 

199. 59 

84. 04 

162. 02 172. 42 18. 14 

w 

14. 75 

378. 22 7. 16 

291 

107. 33 

210. 43 227. 73 24. 37 

V 

15. 39 

469. 42 10. 58 

440. 29 

490 

523. 11 673. 47 85. 74 

VI 

18.87 

566. 74 12. 58 

515. 38 

258. 50 

1464 752. 59 94. 34 

i 

14. 00 

479. 22 12. 12 

565. 76 

323. 32 

846. 04 1283 174. 54 

i 

11. 98 

399. 94 9. 87 

344 

328 

822 902. 22 1832 

(2) 参数估计值 






统一关联行效应 列效应 

行与列效应模型工 


模型 

模型 

模型 

行效应 

^ iVlt) 个旲型 

列效应 

统一效应 

0. 067 

0. 082 

0. 058 

0. 071 0. 078 

n 

— 

—0. 139 

0. 063 

—0. 109 

0. 044 —0. 149 

ID 

— 

-0. 098 

0. 044 

-0. 089 

0. 039 —0. 107 

IV 

— 

-0. 034 

0. 026 

一 0. 025 

0. 022 一 0. 046 

V 

— 

— 0. 125 - 

-0. 021 

-0. 116 

—0. 026 —0. 142 

Yl 

— 

— 0. 032 — 

-0. 032 

— 0. 027 

一 0. 040 —0. 049 

W 

— 

-0. 064 

0. 028 

—0. 049 

0. 013 _ 0. 102 



L 2 

X 2 

df 

P A 

统一关联模型 


167. 32 166. 83 

40 

<0.01 0. 030 

行效应模型 


99. 81 

97. 86 

34 

<0.01 0. 020 

列效应模型 


124. 43 123. 92 

34 

<0. 01 0. 024 

行与列效应模型 I 

67. 95 

66. 29 

28 

<0.01 0.015 

M6 模型 


39. 29 

37. 80 

31 

0. 19 0. 009 


注： （ 1 ) 栏中的整数表示该单元格被精确地拟合。 


(1 9 81)提出了合并职业类别的准则，以避免发生分表的自由度为0这种情形。 
根据他的方法，如果研究者想检验职业类别2与职业类别3是否可以合并，就需 
要 3 个分表。第一个分表是由第二行和第三行构成的 2 X (R — 2) 表，第二列和 
第三列被从这个表中删除。第二个分表是由第二列和第三列构成的 （ R — 2) X 2 
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表，第二行和第三行被从这个表中删除。第三个分表是一个不完整的3 X 3 表: 



n 2 一 ^22 —匕2 n . 3 _ (23 — 匕3 

其中， ni 表示行边缘和， rij 表示列边缘和。如果完全流动模型能够拟合前两个 
分表，并且准完全流动模型能够拟合第三个分表，那么，职业类别 2 与职业类别 
3就可以合并。这3个检验的自由度分别为 (R — 3 )、 （R — 3)、1。它们在表 6. 4 
中被称为“行”、“列”和“对角线”检验(表 6 . 4 给岀了布里格模型中合并的所有职 


表 6. 4将古德曼的职业类别合并准则应用于布里格的阶级分类的结果 


阶级分类 ♦ 

行 

(df = 14) 

列 

(df = 14) 

对角线 
(df = 1) 

合计 

(df = 29) 

阶级 n 





专业人士 (受雇）+经理人员 

33. 05* 

19.77 

0.08 

52. 90* 

专业人士 (受雇）+销售人员(非零售业） 

16. 98 

37. 17* 

0.05 

54.20* 

经理人员+销售人员（非零售业） 

7. 63 

5. 94 

4. 06* 

17. 63 

阶级IV 





文职人员+销售人员(零售业） 

13. 22 

37.80* 

0. 35 

51. 37* 

阶级V 





技术工人(其他行业）+技术工人（建 
筑业） 

26. 86* 

34. 66* 

0. 25 

61.77* 

阶级VI 





技术工人(制造业)+操作工人(制造业） 

47. 43* 

29. 24* 

1.07 

77. 74 # 

技术工人(制造业)+搬运工人(制造业） 

78.07 

52. 39* 

1. 83 

132. 29* 

操作工人(制造业)+搬运工人(制造业） 

27. 78* 

20. 16 

0. 09 

48. 03* 

阶级 YI 





服务业人员+操作工人(非制造业） 

21. 05 

32. 59* 

1. 76 

55. 40* 

月艮务业人员+搬运工人(非制造业） 

42. 96* 

43.32* 

2. 85 

89. 13* 

操作工人(非制造业）+搬运工人(非 
制造业） 

23.44* 

24. 56* 

0. 07 

48. 07* 

阶级™ 





农场主或农场经营者十农业耕作者 

34. 80* 

32. 36* 

23. 19" 

90. 35* 



业类别配对的检验结果）。由于这3个检验是相互独立的，在同一“阶级”内部， 
社会出身与地位获得之间不存在相关关系这一零假设下(被合并在一起的职业 
类别就构成了一个“阶级”），它们相加所得就服从自由度为 2 (R — 3) + 1 的卡方 
分布。使用古德曼的职业类别合并准则所得岀的结果与布里格的结果大相径 
庭。没有任何一对职业类别能够全部通过上述检验。关于准完全流动模型的 
拟合性检验，只有两对职业类别没有通过。可以说在很大程度上，非对角线区 
域的相关性信息在合并过程中丢失了。 

为何使用古德曼的合并准则得岀的结果与布里格的结果存在如此根本性 
的差异？哪里有矛盾呢？其实没有矛盾。古德曼的合并准则要求，在对行内 
的职业类别进行合并检验时，具有一种社会出身 （ i ) 相对于具有另外一种社会 
出身（卩）的发生比对所有的地位获得类别 ( j ) 来说，必须都是一个常数（除了当 
j = i 和 j =卩时）；在对列内的职业类别进行合并检验时，获得一种职业地位 
( j ) 相对于获得另外一种职业地位(: T ) 的发生比对所有的社会出身类别⑴来 
说，必须都是一个常数(除了当 i = j 和 i = : ^时）。但布里格的准则允许这些 
发生比存在较大的变化，只要在阶级内部具有恒定性即可。虽然发生比在阶 
级内部没有什么不同，但在阶级之间却具有很大的差异。在根据步骤 （2) 来 

合并职业类别时，布里格掩盖了一部分相关性，而正是它造成了阶级之间发 
生比的不同。 

职业流动中的地位、自主性和培训 

豪特对流动表的建模方法与克洛格和布里格的方法十分不同。他的论文 
考虑了 3个主题••邓肯 (1979) 和古德曼（197如)所使用的得分尺度的随意性、用 
独立变量来解释继承性模型，以及职业的其他特征（而非地位 特征） 对大表 
(17 X 1 7 ) 中职业流动结构的重要性。为方便起见，哈伯曼 （1974) 的线性乘线性 
交互模型(公式 5. 4 )对职业分类采用了常见的单一尺度得分法(见公式 5 . 5) 。 

任何已知的得分都可以被代人。研究者考虑最多的职业特征是职业地位，因 
此，公式 5. 5被取 代为： 



其中， SjSj 表示职业类别 i 和 j 的 SEKDiincan ， 1%1)得分均值。还可以在模 
型中加入职业特征的其他维度，所使用的标记如下 :Ai (如果 从事职业类别丨的 
人有一个直接上司或监管人，则将发生比的值 乘以一(表示 从事职业类别 1 
的人受到过特定的职业培训）。以上两个变量都用综合社会调查1972年至 
1980 年的合并样本来进行估计 ( NORC ， 1980; 详见 Hout ， 待出）。 

此外，像公式 5. 13那样在模型中引入虚拟变量(乙）来加入对角线效应，它 
在对角线单元格上取 1( 否则取 0) 。当该虚拟变量乘以由尺度变量(地位、自主 
性或培训)所构成的函数时，这一效应的系数表示的是对角线单兀格偏离表格 
其他区域的关联模式的情形。这一方法不同于用 R 个变量来精确拟合对角线 
单元格这种常用的“准”模型，它只用了 3个变量来反映对角线效应。这3个变 
量的含义是，对于某个给定的职业类别，观测到的对角线频数偏离非对角线区 
域关联模式的情形是与该职业类别的地位、自主性和培训成比例的。 

在这一模型下，期望频数服从下述公式： 

log(Fij) = ao + aii + a 2 j + bi SiSj + b 2 Ai Aj + di ZjSj 2 + c^ZiAe ^ZiTi 

[6. 4] 

其中，当 i = j 时，在 =1 (否则就等于 0) 。注意， X 并没有被包括在主效应中，在 
对角线效应中也没有取平方。因为初步分析发现，主效应并不重要，并且刀的 
线性形式比 T ? 的拟合度更好。模型中还有4项并没有在上述方程中体现出 
来。它们都是虚拟变量，反映了流入与流岀农民职业阶层的情形比预期的少。 
这4个变量允许个体在农民职业阶层与另外4个职业阶层之间的流动模式存在 
差异，它们分别是:（1)上层非体力职业阶层；（ 2 )下层非体力职业阶层； （3) 上层 
体力职业 阶层； （4) 下层体力职业阶层。这些变量的效应被假定为是对称的，也 
就是说，不管是社会出身还是地位获得为农民职业阶层，所对应的变量效应是 
相同的。 

在豪特的论文中，上述 SAT 模型被应用于父亲的职业与儿子现在的职业 
所构成的流动表。我将该模型分别应用于1962年和1973年父亲的职业与儿子 
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的第一份职业所构成的流动表，并且将白人样本和黑人样本分开，得到了表 6 . 5 
中的结果。模型并不拟合白人样本的数据，尽管 L 2 与自由度的比值和其他许 
多模型相当。但模型却能够拟合黑人样本的数据。在解释这一反差时，必须小 
心谨慎。请留意，黑人样本数据与白人样本数据的△值相差 不大。 这种△值之 
间的少许差别表明， L 2 之间的差异更有可能是由样本规模的差异，而非模型本 
身的拟合度差异所导致的。当对白人样本的几个出生组分别进行分析时，模型 


对每一个岀生组数据的拟合度都是可以接受的。 

表 6. 5父亲的职业与儿子的第一份职业之间的 
流动 ( 分种族和年份）: SAT 模型的估计结果 



白人 

1962年 

黑人 

白人 

1973年 

黑人 

(A) 主效应 

地位 (bl) 

0. 735* 

0. 430* 

0. 618* 

0. 642* 

自主性 （ b 2) 

0. 450* 

0. 783* 

0. 354* 

0. 310* 

(B) 对角线效应 

地位 (dl) 

—0. 202* 

一 0. 250 

-0. 194* 

—0. 096 

自主性 （ d 2) 

0. 142* 

0. 028 

0. 100* 

0. 155 

培训 (d3) 

0. 221* 

0. 168* 

0. 201* 

0. 154* 

(C) 拟合优度 

L 2 

529. 38 

228. 05 

631. 51 

161. 33 

X 2 

555. 24 

321. 19 

660. 24 

158. 96 

df 

247 

247 

247 

247 

P 

<0.05 

>0. 50 

<0.05 

>0. 50 

△ 

0. 075 

0. 143 

0. 046 

0. 089 

N 

10022 

836 

18141 

1833 


注： • 表 7K p 0. 05。 


模型的参数估计值几乎从各个方面（除了一个方面 之外) 体现了预期的流 
动模式。职业的地位特征和自主性特征对总体流动性的影响很强，并且对黑人 
和白人来说都非常显著。自主性对继承性的影响在黑人和白人中都是正向的， 
但只有在白人中才显者。职业培训特征的影响在两个年代和两个人群中都很 
强’而且是正向的。岀乎意料的结果是，职业的地位特征对继承性的影响是负 



向的。它之所以出现在公式中，唯一的原因是要用它来控制职业培训特征中所 
包含的地位特征成分。 

与布里格的模型相比，豪特的模型揭示出，职业地位对代际流动的实质性 
影响更大，而且，它用职业之间在培训和自主性特征上的差异解释了大部分的 
对角线效应。相比之下，布里格的模型只是简单地删除了对角线单元格而已。 
最后，豪特的模型还简约很多，它仅仅拟合了 9个交互项参数，而布里格的模型 
则拟合了 195个。 



第 


7章 I 流动表在家庭和宗教研究中的应用 




流动表的行分类与列分类具有一致性，这种特性在其他研究领域中也可以 
见到。当行与列在分类上相同时，本书所介绍的许多模型都可加以应用。当这 
种分类还可以进行某种排序时，则前文中提到过的所有模型都可以应用。本章 
将回顾把流动表分析方法应用于其他研究领域的4个例子。 

丈夫与妻子的职业 

在夫妻都有工作收入的家庭中，将丈夫的职业与妻子的职业进行交叉分类 
而得到的列联表看起来非常像一个流动表。不仅行与列在分类上具有一致性， 
而且这种分类也是职业分类。不同的是，流动表中的行与列表示的是人们在两 
个时间点上所从事的职业类别。但在夫妻职业列联表中，行与列则表示在同一 
时间点上一个人与另一个人所从事的职业类别。豪特 （1982) 分析了 1978年3 
月时，丈夫职业与妻子的职业之间的相关性。表 7. 1给岀了他的分析结果。 


表 7. 1双收入家庭中丈夫的职业与妻子的职业之间的相关性分析 (1978 年3月) 


妻子的职业 


丈夫的职业 

上层非体力 

下层非体力 

蓝领 

服务业 

农业 

(1) 观测频数 






上层非体力 

1708 

1872 

236 

416 

26 

下层非体力 

405 

836 

142 

192 

3 

蓝领 

741 

2242 

1297 

1125 

34 

服务业 

149 

279 

112 

245 

3 

农业 

62 

97 

34 

67 

114 
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续表 


丈夫的职业 

上层非体力 

妻子的职业 

下层非体力 蓝领 

服务业 

农业 

(2) 同质行与列效应模型 I 的期望频数 




上层非体力 

1708 

1877. 55 

230. 34 

422. 03 

20.08 

下层非体力 

398. 61 

836 

145. 31 

192. 86 

5. 22 

蓝领 

751. 68 

2233. 67 

1297 

1121.68 

34. 97 

服务业 

135. 44 

291. 53 

110. 30 

245 

5. 73 

农业 

71. 27 

87. 25 

38.05 

63. 43 

114 

(3) 同质行与列效应模型 I 的参数估计值 




统一效应 

-0. 090* 





行/列效应 


0. 299* 

—0. 108* 

-0. 175* 


模型 


L 2 

X 2 

df 

P 

完全流动模型 


2263. 38* 

3921. 35* 

16 

<0.05 

准完全流动模型 


364. 14* 

368. 14* 

11 

<0. 05 

准统一关联模型 


151. 78* 

163. 07" 

10 

<0. 05 

准行效应模型 


78. 70* 

85. 68* 

7 

<0.05 

准列效应模型 


111.45* 

110. 96* 

7 

<0.05 

准模型 I 


5. 30 

5. 08 

4 

0. 18 

准模型 n 


14. 73* 

10.49* 

4 

<0.05 

准同质模型 I 


9. 78 

9. 49 

7 

0. 20 

准同质模型 n 


19.38* 

15.56* 

7 

<0.05 


注：“表 7K p < 0. 05。 


在流动表中，社会出身与地位获得之间存在的时间先后顺序使得因果变量 
的区分非常清楚。但在夫妻职业列联表中，并不存在这种表示因果关系的时间 
顺序。两个变量之间的影响是相互的，或者说，它们之间的相关性可能是由共 
同的外在力量所导致的，例如，基于教育和阶级的婚姻匹配。这种互为因果的 
特点使得在建模时需要优先考虑对称性。因此，就要特别留意具有对称性的相 
关模 型:统 一关联模型和模型工与模型 n 的同质形式。正如表 7. 1的最后一栏 
所示，对1978年的夫妻职业列联表数据来说，准同质行与列效应模型 (模型工） 
是最优模型。 

丈夫的职业与妻子的职业之间的相关性大多体现在对角线上，完全流动模 
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列表败据分析 


配偶的职业 
( b ) 下层非体力：蓝领 


1 2 3 4 5 

配偶的职业 

( a ) 上层非体力：下层非体力 


配偶的职业 
( c ) 蓝领：服务业 


配偶的职业 
( d ) 下层体力：农民 


型与准完全流动模型的： L 2 值之差达到了 1899. 24( 自由度个数之差为5)。其余 
的相关性体现在同质行一列效应和一个负的统一关联参数上。在列效应与负 
的统一关联参数的共同作用下，妻子从事下层非体力职业相对于从事蓝领职业 
的发生比具有正的斜率，但妻子从事服务职业相对于从事农民职业的发生比以 
及从事上层非体力职业相对于从事下层非体力职业的发生比则具有负的斜率。 
然而，需要注意的是，上述斜率都排除了对角线效应(尤其是上层非体力职业阶 
层与农民职业阶层的对角线效应)的影响，因此，非对角线区域的相关关系的负 
斜率其实就相当于校正了在职业层级两端存在的极大的对角线效应。这在图 
7.1 中表现得十分清楚。虚线表示的是仅仅基于统一关联参数和列效应所假设 
的相关 关系; 实线连接的是完整模型下的期望频数。虚线与实线之间的差别显 
示了行效应与对角线效应的重要性。 












I 歸 I I 晒 一 I 一 
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图 7.1 同质行与列效应模型(模型 I ) 下的期望 logit 值: 
丈夫的职业与妻子的职业之间的相关性分析 
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婚姻的宗教匹配 

一 些研究者可能会认为，表 7. 1中丈夫的职业与妻子的职业的相关性确实体 
现了婚姻匹配。但是，既然表中的职业是夫妻二人现在的职业，那么，这种相关性 
既有可能是婚姻匹配所导致的，也有可能是夫妻二人婚后所发生的一系列事件所 
导致的。然而，如果能够获得夫妻二人的婚前资料，流动模型仍不失为研究婚姻 
匹配的理想工具。约翰逊 (1980) 将流动模型应用于婚姻宗教匹配的研究就是一个 
很好的例子。使用夫妻二人16岁时的宗教信仰数据，他建构了第3章所介绍的跨 
越参数模型，以期望获得有关宗教信仰对于婚姻市场之重要性的新见解。 

根据前面的介绍，跨越参数模型提出，每相邻两个职业类别之间存在一个 
跨越界限，其跨越难度由一个参数 ( v s ) 来表示。第 ( i ， j ) 格上的期望频数是从职 
业类别 i 到职业类别 j 所需跨越的界限数目的函数。在应用这一模型时，职业类 
别的排列次序必须是唯一的，只有这样，才能清楚地知道对行类别与列类别的 
每一个组合来说，究竟跨越了哪些界限。 

宗教类别通常来说是没有排列次序的。然而，约翰逊 (1980:69 — 89) 根据罗 
基奇 ( Rokeach ，1960) 所描述的宗教类别之间的“认知上的社会距离”远近提出 
了一个排序。罗基奇发现，在美国兰辛和密歇根的两个社区中，浸礼会教徒与 
天主教徒这两个宗教群体之间在认知上的社会距离最远。他还在研究中发现， 
如果按照“认知上的社会距离”画一条直线，浸礼会教徒和天主教徒分别位于这 
条直线的两端，那么其他4个宗教群体——卫理公会教徒、长老会教徒、路德会 
教徒和圣公会教徒——都可以沿着这个单一尺度进行排序。在进行了一个分 
类改动(即将长老会教徒与圣公会教徒这两个群体进行合并)之后，约翰逊借助 
这一排序，用跨越参数模型拟合了宗教群体之间的婚姻匹配数据。但是，美国 
人的宗教信仰并不仅仅局限于上述6种。其余的宗教倾向（包括“没有宗教信 
仰”)都被混在一起当做一个剩余分类(而且它包括的人数还相当多），约翰逊将 
它与作为“主流”宗教群体的基督教徒同等对待。 

约翰逊提岀了 k 个模型，具体见表 7. 2。注意，他将行边缘效应与列边缘效 



应约束为相等，而且，交互效应具有对称性。两个模型的唯一差别在于对角线 
的处理。第一个模型 ( CFS ) 约束对角线效应，即“同类婚”，对每个宗教类别来说 
都 相同; 第二个模型 ( CS ) 放松了这一约束。两个模型都包括两类跨越参数，其 
一是拟合每一个宗教群体与主流宗教群体之间的界限(被设定为不等），其二是 
拟合除主流宗教群体之外的“其他”宗教群体之间的跨越参数(被设定为相等）。 
约翰逊分析了 4 组数据。我只回顾其中一组数据结果，即1973年至1976年的 
综合社会调查数据 ( NORC ， 1980)。在 0.05 的显著性水平上， CFS 模型能够拟 
合数据，但 CS 模型的拟合优度有更显著的提高。模型的参数估计结果见表 
7. 3。表中还报告了由约翰逊计算的两个参数 :其一 是每个宗教群体人数占总人 
口的比例 (Pi) ， 其二是模型所预期的每一个宗教群体中选择与本群体成员结婚 
的人数比例 ( U 。 “同类婚”在“其他”宗教群体中表现得最普遍。路德会教徒的 
同类婚比例也比较高。卫理公会教徒与长老会教徒/圣公会教徒的合并群体之 
间的距离最远。 CS 模型与 CFS 模型之间的主要区别在于对“其他”宗教群体的 
“同类婚”比例的估计，以及对“其他”宗教群体与主流宗教群体之间社会距离的 
估计。 CFS 模型约束“同类婚”比例在每一个宗教群体中都相同，并且将“其他” 
宗教群体与主流宗教群体之间的社会距离定义得比较高。对这一约束的放松 
会使“同类婚”比例在“其他”宗教群体中有所增加，作为抵消，改动后的模型对 
“其他”宗教群体与主流宗教群体间的社会距离的估计会相应降低。 

宗教信仰的社会化 

麦克雷 ( McRae ，1979) 对宗教出身与宗教信仰之间的相关性进行了探索性 
研究。麦克雷的分析饶有趣味，原因有两个。第一个原因是实质意义上的，很 
明显，这一研究主题本身令人感兴趣。第二个原因是形式上的，在于分析中引 
人了其他变量。麦克雷估计了在1958年和1971年的底特律市，父亲和母亲的 
宗教倾向对于成年子女宗教倾向的影响。他考察了 3类宗教 群体: 新教徒、天主 
教徒和其他宗教信徒。麦克雷模型的最一般化的形式是分性别的对偶对角线 
效应模型，它包括3个效应，分别是母亲的影响效应(作用于那些母亲与子女具 
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列表数据分析 


f ^^ ri 昍婶宕 Ii : 鎵雜 s ^ l 黎潞刼，/胚蚝运联菰起、猞灰^田”坩 



其他 


1 

0. 786 


O 

r—H 

• 

o 

LO 

寸 

• 

o 


1 

1. 944 


0-10 

0. 45 






-0. 918 






—0. 340 




天主教 


0. 668 

0. 786 


0. 28 

0. 62 


0. 203 

0. 936 


0. 28 

CM 

• 

o 






-0. 171 






一 0. 075 




路德会 


卜 

• 

O 

0. 786 


0. 12 

0. 36 


-0. 565 

1. 198 


0. 12 

0. 42 

宗教类别 





— 0. 389 






-0. 363 




长老会 


-0. 249 

0. 786 


0.09 

0. 31 


一 0. 633 

0. 750 


0. 09 

• 

o 






-0. 413 






-0. 449 




卫理公会 


0. 154 

0. 786 


0. 15 

0.42 


-0. 135 

o 

LO 

寸 

參 

o 


0. 15 

o- 

co 

• 

o 






— 0. 255 






一 0. 339 




浸礼会 


0. 636 

0. 786 


0. 26 

0. 61 


0. 303 

0. 661 


0. 26 

0. 61 

毅 

. 


(1) CFS 模型 

边缘效应 

对角线效应 

跨越效应 

占总人口比例 

同类婚比例 

副 

(XI 

边缘效应 

对角线效应 

跨越效应 

占总人口比例 

同类婚比例 


f 肿 9 &lle l> 61 ) 44 4nHISii iJr +s> 親雜 = 到 »83 品 S.G SS53 蘇胀習餿迄尔 e l> « 



流动表分析 


169 


有相同宗教倾向的单元格）、父亲的影响效应(作用于那些父亲与子女具有相同 
宗教倾向的单元格）、同类效应(作用于母亲、父亲与子女都具有相同宗教倾向 
的单元格）。模型的具体表述见表 7. 4,期望频数和参数估计值见表 7. 5。请留 
意，麦克雷对许多参数都进行了约束。 


表 7. 4宗教信仰的代际传递 :麦克 雷的对偶对角线效应模型的参数化(相乘形式) 


父亲的 
宗教信仰 

母亲的 
宗教信仰 

新教 

受访者的宗教信仰 
天主教 

其他宗教 

新教 

新教 

dpt nipt Hpt c| 

1 

1 


天主教 

dpt 

n\tq 

1 


其他宗教 

dpt 

1 

m ot 

天主教 

新教 

m pt 

d c t 

1 


天主教 

1 

dct hct 

1 


其他宗教 

1 

dct 

niot 

其他宗教 

新教 

m pl 

i 

dm 


天主教 

1 

met 

dot 


其他宗教 

1 

1 

dot rriot hot 


注: 该模型同时对两个不同年份时父亲的宗教信仰、母亲的宗教信仰以及受访者的宗教信仰之间的交 
叉分类数据进行拟合。 d 表示父亲的影响效应(给定宗教类别和年份）， m 表示母亲的影响效应（给定 
宗教类别和年份）， h 表示同类效应(给定宗教类别和年份）。 


表 7. 5宗教信仰的代际传递 :麦克 雷模型的参数估计值 


参数 

年份 

受访者的宗教信仰 
新教 天主教 

其他宗教 

父亲的影响效应 ( d ) 

1958 

17 

5. 9 

2. 2 


1971 

1. 7 

5.9 

2.2 

母亲的影响效应 ( m ) 

1958 

4.3 

5. 9 

2. 2 


1971 

4.3 

5. 9 

2. 2 

同类效应 ( h ) 

1958 

1.0 

1.0 

7.5 


1971 

1.0 

1. 0 

1.0 


注 :表中 所报告的系数是就模型的相乘形式而言的 （1. 0表示不显著）。之所以会出现数值相同的系 
数，是约束条件使然。 


最主要的发现如下 :不管 是父亲的宗教倾向还是母亲的宗教倾向，都对子 
女的宗教倾向有显著的影响;父母亲的这种影响在男性样本和女性样本中同样 
重要; 母亲的影响大于父亲的 影响; 在1958年时，如果父亲和母亲的宗教信仰相 
问，就会强化儿童 f 旨仰“其他”宗教的社会化过程。 



第 8 章 I 总结 


让我来最后总结一下本书对流动表和类似的列联表分析模型的概述。要 
延续前面概述的研究工作，首先需要将流动表方法和回归方法进行整合。邓 
肯、布里格、豪特和洛根都在朝这个方向努力，但还有更多的工作要做。其中一 
项重要的工作便是将这些模型应用于新的研究领域。父母政治倾向对子女政 
治倾向的影响是相当强的 ( Knoke ， 1976)。夫妻之间的许多共同特征都可以用 
这些模型来进行研究。追踪研究也同样适用于这种建模方法。 

最后，多元变量的建模已经幵始成为一个议题。山口、豪特和洛根都考虑 
到了外在因素对社会流动过程的影响。至于如何将外生变量的限制性效应纳 
人模型，还有更多的工作需要完成。对社会流动研究来说，这是一个特别重要 
的领域。希望本书能够推动对上述主题的研究。 
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社会和公共舆论调查通常询问的问题的答案多为类别。这些答案的类别可以完全 
是离散的或者定序的。让我们考虑一个由古德曼 • 克洛格和其他学者分析过的经典数 
据表 一 曼哈顿中城 (Midtown Manhattan) 精神健康和父母社会经济地位(洗 S) 数据。 


父母的社会 


精神健康状况 


经济地位 

良好 

一般症状 

中度症状 

重度症状 

A (高） 

64 

94 

58 

46 


(48.5) 

(95.0) 

(57.1) 

(61.4) 

B 

57 

94 

54 

40 


(45.3) 

(88.8) 

(63.4) 

(57.4} 

C 

57 

105 

65 

60 


(53.1) 

(104.1) 

(62.6) 

(67.3) 

D 

72 

141 

77. 

94 


(71.0) 

(139.3) 

(83.7) 

(90.0) 

E 

36 

97 

54 

78 


(49.0) 

(96.1) 

(57.8) 

(62.1) 

F (低） 

21 

71 

54 

71 


(40.1) 

(78.7) 

(47.3) 

(50.9) 


尽管社会科学家的专业出身不同,但他们分析以上数据的一个通常做法是检验两个 
变量(或者多向表中多于两个变置），在这里即精神健康状况和父母的社会经济地位是否 
相关。而在统计学用语中，我们会关注一个关于独立性的虚无假设能否被拒绝。一些基 
本的统计学课程通常会讲解皮尔逊卡方检验和似然比检验的应用。简单地观察频率表 
(上表括号里的数字为期望频率)将无法得出结论。如果我们使用 h 指代表中第 i 行和 
第 j 列的观察频率^的期望值，那么， Rj 在独立模型(父母的 SES 和精神状态）中则可表 
示为： 


这里, f i + 表示第丨行的列总和， f + j 表示第 j 列的行总和，而 f ++ 则表示整个表格的总和。 
为了检验独立性假设，我们计算皮尔逊 X 2 系数和似然比系数 L 2 : 

和 L 2 =2 f ^> (奇） 

应用这些公式，我们获得了一个皮尔逊 X 2 值 45. 985和似然比 L 2 值 47. 418。在自 
由度为15《行数减去1的差乘以列数减去1的差）的情况下，我们在所有常用的显著性 
水平上拒绝关于独立性的虚无假设,并且结论是精神健康状态和父母的 SES 不是彼此 
独立的，或者换一种说法，它们以某种方式相互关联。 

然而，尽管我们知道它们以某种方式相互关联，但是我们并没有充分利用已有的信 
息来进一步探索它们相互关联的形式。作为对数线性模型中的一种，关联模型正是为这 
一目的而建立的。之前我们进行的检验相当于对数线性模型中的主效应估计。使用单 
一性关联模型(也被称为“线性相关关联模型” } : 

In Fij = X + Xf + xf + pUiVj 

这里的前 3 项代表主效应对数线性模型，其附加项则表示两个变量各自的观测数值组之 

间的关联程度，这样，我们就获得了自由度为 14 的皮尔逊 X 2 值 9. 732 和似然比 L 2 值 
9.895 。 因此，引入 )3 参数，我们仅仅损失一个自由度便可以保留“存在线性相关卡方值” 
这个虚无假设。至此，读者一定对关联模型的检验能力有了深刻的印象。 

作为不仅在自己的研究领域中应用关联模型，并且为关联模型的发展作出贡献的关 
键学者之一，黄善国这本著作正是社会科学领域所忽略的内容。他将带领我们走进一段 
旅程，领略更多不同形式的关联模型，例如，行效应模型、列效应模型、行列效应模型、行 
列乘法效应模型和其他多种不同的形式，包括为涉及多种因素的多向表设计的模型。 

在上述例子中，我们引入了一个统计值表示任意分配的两组数值的关联情况，但这 
个统计值并非固定不变，它可以由模型估计得来。为了我们的研究工作而学习这种模型 
和其他不同的、令人兴奋而且有用的关联模型，只要进入书中描述的关联模型的奇境 
即可。 


廖福挺 {Tim F . Liao ) 


第 1 章 I 简介 


许多社会科学的数据都会很自然地被纳入交互表格的形式。比如，在社会 
学方面，教育水平和职业的关系存在性别差异和/或者种族差异、社会网络中的 
友谊模式、择偶中的跨国因素和/或者时间变化;在地理学方面，存在城市邻居 
关系随时间变化的特点和省际或区域内移民流动情况的时间变化;在经济学方 
面，存在全球经济系统中进出口贸易的动态变化趋势;在政治科学方面，存在阶 
级地位、政党认同以及选举之间随时间变化的关系；最后，在心理学方面，存在 
关于刺激识别和刺激类化的实验数据。尽管我们所关心的是探索它们的系统 
性联系，但是有时应用适当的统计工具来诠释和理解其中关系的意义及其复杂 
性却存在困难，对于研究新手而言更是如此。 

过去，学者尝试过各种各样的方法来计算表格形式下行与列的关联情况。 
例如，如果假设研究中涉及的变量在本质上是排序的，那么便可以使用一些测 
量关联程序的定序测量方法。然而，这些关于关联程度的测量方法不仅无法提 
供优比(或者它们的对数)的自然变换功能，而且它们同样无法避免受到边缘分 
布的影响 (Clogg & Shihadeh， 1994:19)。因此，拥有相同优比的表格由于不同 
的边缘分布将产生不同的关联测量值 （Agresti， 2002； Bishop, Fienberg 8^ 
Holland, 1975； Fienberg，1980； Rudas, 1997: 第 2 章）。更重要的是，这些测 
量关联程序的单一方法，尤其当行和列的类别数量比较多的时候，经常无法提 
供交互表中关于关联程度的全面描述。 

除了使用以上这些描述型方法之外，另一个替代性的策略是发展源于实证 
研究并可进行正式检验的关联程度测量方法。对数线性模型的发展 (Bishop et 
al. ，1975； Fienberg, 1980； Haberman, 1978) 为我们提供了理解多个定类或定 







拜表数据分析 


序变量之间关系的重要途径。但是在多维交互表中，当每个变量的类别数量增 
多而出现许多需要诠释的参数时 (Goodman， 2007,在定类数据分析中使用对数 
线性模型的非技术但富有洞见的介绍），我们便需要解释那些非结构性交互项 
系数。经过古德曼的努力及其后的克洛格和邓肯及其他合作者的发展，我们现 
在拥有了一系列非常丰富及适合此类分析的统计模型，尤其是关联模型。虽然 
关联模型被社会分层研究学者广泛使用，尤其在社会流动和择偶的研究领域 
(Breen， 2004； Grusky & Hauser, 1984； Hout, 1988； Smits, Ultee & Lam- 
mers， 1998、 2000； Wong, 1990、1992、 2003b； Xie，1992； Yamaguchi, 1987), 
但是这种统计技术仍未能普及至其他社会科学领域。我想部分原因是，那些最 
重要的统计和应用文献分散在不同的杂志里，而且它们的讲解主要集中在简单 
的二维交互表中。除了克洛格等人的努力外，至今还没有人系统地将各种关联 
模型整合到一个一以贯之的框架中。 

呈现在您面前的这本《关联模型》尝试填补这个重要的空白。通过仔细讲 
解关联模型知识中检验优比的底层结构，本书提供了一个全面而统一的框架来 
分析和理解任何以交互表形式呈现的社会或自然科学数据。拥有回归模型和 
广义线性回归模型一般知识的读者，在理解本书涉及的知识方面应该不存在困 
难。虽然本书并不要求读者具备对数线性模型的知识，但具备者会更容易领略 
及明白其中的奥秘 (Agresti， 2002； Fienberg, 1980； Powers Xie，2000)。 本 

书可被视为其他专著的一个自然拓展，如戴维 • 诺克和彼得 • J. 伯克 （1980) 的 
《对数线性模型》、迈克尔 • 豪特 (1983) 的《流动表分析》等。我们的读者可能发 
现，同时阅读以上著作将大有裨益。 

该书的内容组织 如下： 

第2章回顾了特别适用于分析双向表的一系列关联模型。为了协助我们理 
解，本章还重点讲述了在不同关联模型设置下的优比结构以及它们彼此之间的 
系统联系。然后，本章列举两个实例加以说明，数据来自不同年份的美国综合 
社会调查 ( GSS )( Davis，Smith & Marsden , 2007)。在全面讨论了如何分析双 

向表之后(双向表是分析复杂表格的基础），本书的 其他章节主要 讲解多维或多 
向表的分析，特别是通常适用于多向表，被称为“多维关联 模型” ( Wong ，2001) 



的统计模型，它在分析多维交互表中复杂的交互项模式时，将被证明是非常有 
用和灵活的。 

第3章详细讨论了在高阶多维表中的条件独立性和偏关联模型。在这种情 
况下，我们没有必要为变量之间三向的或高阶的交互项建立模型。本章首先探 
讨将各种二路交互系数分解成更简单但更容易解释的成分的方法，最后列举了 
有关模型分析的两个实际例子，以此深入了解基本的关联模式。 

第4章讨论了二路和三向交互参数都不能被忽略的情况。除了介绍几种不 
同的统计上强大的层效应模型，它还介绍了多维关联模型中的相似类型，以理 
解复杂的关联模式。本章将举两个实例进行具体分析，一个涉及分组变量(性 
别和时间），而另一个涉及时间差异。 

第5章提供了另外两个例子，进一步演示了在社会科学应用中关联模型的 
有效性。第一个讨论所有社会科学研究者都将遇到的共同 问题: 表格(行和列） 
中某些类别是否可以合并的问题 ( Gilula ， 1986; Goodman , 1981 c )。 乍看之下， 
这好像是一个琐碎或者微小的问题，但它却有助于我们深入了解一个经常被实 
证研究者忽略的 议题: 在不恰当的情况下组合行和列类别而导致的扭曲和偏差 
(更多细节请见 Wong , 200 3 b )。 第二个例子介绍关联模型的另一种可能的用 
处:作为一种最佳的量度工具，如何从多维表中基本的关联模式里实现类别的 
测量 (Clogg & Shihadeh ， 1994； Smith & Gamier , 1987)。这两个例子采用、延 
伸、扩展了涉及以前一些相同话题的文献。 

第6章讨论了定类数据分析中一些最新的进展，以及它们与多维缩放的关 
联模型是如何相联系的。 

最后，为了增强理解和鼓励进一步的应用，读者可以登录 Sage 的相关网站 
(WWW. sagepub . com / wongstudy ) 下载例子中讨论的所有统计模型的输入与输 
出文件。我们希望本书有关关联模型的系统讲解和所举实例对涉及多向交互 
表的研究分析能有所帮助。 



第 2 章 I 双向表中的关联模型 





让我们以行变量为 A 、 列变量为 B 的双向交互表开始讲解，其中的类别分 
为 I 和 J 。 读者请注意，我们的分析并不要求先验地区分因变量和自变量，尽管 
大多数实证研究者常常在他们的分析框架中作岀此区分。为了理解两个(或更 
多)变量是如何彼此联 f 的，究竟选择使用对数线性关联模型还是其他未饱和 
统计模型，关键是要认识到所有这些模型都是以谨慎的态度试图获悉嵌入表格 
中的优比。主要的差别存在于优比基本结构的具体方程中。通过它们的观察 
和期望频率进而比较观察和期望优比，我们就可以更好地理解其中的关系。 

作为基础的优比 

如果我们将 7 T 定义为成功概率，将 （1 一 7 T ) 定义为失败概率，那么，比率表示 
为 n = —7 U )。 例如，当 n = 2时，意味着成功概率是失败概率的两倍。相 

反，当 n = 0. 5时，成功概率只有失败概率的一半。对于一个2 X 2表，可得到两 
个比率 ( a 和 a ) ，一行一个。两行的比率 a 和比率 n 2 的比值可被定义为 

0 = = ( 兀11 /兀12 )/(兀21 /兀22 ) = (TTll X TC 22 )/(兀12 X 7 T 21 ) ，这里的兀11、兀12、兀21 

和 7 U 22 代表单元格概率的联合分布，单元格概率的第一个和第二个下标分别表示 
具体的行和列单元格。0被称为“优比”或者“交差乘积比” ( Yule ， 1912)。注意， 

0的公式是对称的，因为从第一列和第二列计算得来的优比0的值保持不变(细 
节请见 Rudas ， 1997)。 

对于任何 I 和 J 的双向交互表而言 ，一 般会有（ I 一 1 KJ 一 1) 个不同的优比， 
尽管存在不同的方法计算一组完整的优比值。两个通常的做法如下： （1) 将特 
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别的行和列(如第一^彳了和第一'列或者最后一 ■行 和最后一 '列） 作为参照； （2) 采用 
列举中相邻近的行和列 ( Agresti ，2002：45—46) 0 例如，如果我们使用行 i ' 和列 
j ' 作为参照，那么，一整套观察优比的对数可以简洁地表示如下： 

log 0:，《^ log fij + log f 吖 一 log 一 log f 。 [2. 1] 

这里小 代表单元格 G ， j ) 的观察频率。另一方面，观察到的邻近优比(观察到的 
本地优比）的对数可表示如下： 

log 0 ; - = log fij + log f + 1 ， 汁 1 — l°g fn - 1 , j — log fi , 汗 1 [2. 2] 

这里 ， i = 1，2 ，…， I — 1 ， j = 1，2 ,…， J — 1。从公式 2. 1 和公式 2. 2 中可轻易 
地看到 ， log 可被看做 log 0〖的函数，反之亦然。换言之，尽管在这两个公式 
下的优比值有所差异，但是在二维表格中，只存在 — — 个不同的优比。 

另外需要留意的是，如果特定的行和/或者列乘以一个常数，公式 2. 1和公式 
2.2 中一整套优比将不受影响。对于某些应用而言，这个边界不变性质是令人 
重视的，因为这种优比有助于我们理解行与列变量之间的基本关联情况。例 
如，在研究社会流动时，边界差异是必然会出现的，因为它们代表了职业或者阶 
级在不同时间点上的分布，所以我们的兴趣转向流动的层面。在其他的社会科 
学应用中，我们经常会增加某些个体或个案的样本量。然而，这情况对表格数 
据的分析将不会受到过度取样的影响，因为优比的数值在加权或者非加权形式 
中都保持不变。 

在特定的模型设置中，观察频率可以被它们相对应的期望频率替代，并且， 
一 组完整的期望优比对数可以表示为 log 或者 log 0 U 。 优比的值可以等于 
任何非负数值，范围落在0与 oo 之间。与之相应，优比的对数值域将在 一 oo 和 
oo 之间。当 ftj = 1或者 logGij =0时，变量 A 和变量 B 是相互独立的。正如之 
前提到的，优比同样可以理解为两种可能性的比率。如果这个比率大于（或者 
小于） Mt 表第一种结果(行 i ) 的列 j 比列 j ' 的可能性大于(小于)代表第二种结 
果的列 j 比列，的比率。当这个比率等于1时，这两种结果的可能性是相等的。 
log 〗 ij 的标准误可按如下公式计算 ( Agresti ，2002:71): 
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o (log 0 y ) = 


5 


1 


T 


n H-l, j n H~l,hH 


[2.3] 


在传统二维表格的对数线性模型中，假定变量 A 和变量 B 相互独立的基准 
模型被称为“独立/虚无关联模型”(0)。这一模型假设行 （ A ) 和列 （ B ) 变量之 
间相互独立或者没有关系。如果我们让^和 Fu 分别表示在变量 A 和变量 B 的 
交互表中观察到的和期望的单元格频率，这个独立/虚无关联模型就可以表示 
如下： 

log Fij = X + + \ B [2. 4] 


这里的 X 是总均值， xf 表示行边界参数，而 xf 则表示列边界参数，它们都服从 
于正态分布 

#和 <是总均值的边界导数，这一正态化过程被称为“效果编码”。另一 
个替代性的正态化则使用虚拟编码，这时 xf = 在后面的公式中，第一行 

和第一列的边界参数充当参照组，而其他; ^和邛 参数值则代表参照组的导数。 
无论采用其中哪一种正态化方法，尽管它们个别的参数估计值并不相同，其拟 
合优度值、自由度和期望频率都是相同的。这个模型拥有 U — 1 一 （I 一 1) 一 ( J - 
1) = ( I 一 1 KJ 一 1) 个自由度。在独立模型中，很容易证明所有优比(或局部优 
比)的对数都等于0,即 


log 0 ij = 0 [2. 5] 

如果独立模型是符合实际的，那么，对数似然卡方值 （ L 2 或 G 2 ) 将服从乂 2 
分布 ( Agresti ， 2002:78)。这样，我们就可以利用这一统计值检验变量 A 和变 
量 B 之间是否存在显著的关联性。当独立模型无法拟合数据时，我们便可推断 
行和列之间存在显著的交互作用或者关联性，而且完全交互作用 （ FI ) 模型可 
写成： 


log Fij = A + Af + Af + A^ 8 [2. 6] 

不幸的是，公式 2. 6 的 FI 模型使用了所有剩下的（ I 一 1 )(J 一 1) 个自由度 
作为交互作用参数，而变成了一个自由度为0的饱和模型。尽管通过这一交互 



作用模型可能足以理解行与列变量之间的关系，但是用以解释的可用参数有数 
量上的问题，尤其在行或者列的类别数量增多时更为严重。 

如果我们小心地检验交互作用参数，那么，我们常常会观察到，当数据拟合 
令人满意时，这些参数的数量会显著减少。简化模型的一个策略是，令这些参 
数等于相似数值和/或者删除那些显著度不高的参数。然而，除了使用这种选 
择特定参数的老办法外，更值得采纳的是以一^种系统的方式开发简约的非饱和 
模型，它足以捕捉二维交互表格中的交互作用。我们愿意寻找中间（非饱和)模 
型的另一个重要原因是，我们的兴趣通常不在于发现行和列变量之间是否存在 
关联性，而在于发现这一关联性的基本模式或者结构。当然，当这些推断的模 
式或者结构可在现实意义中被解释时，我们对分析将更有信心。这一问题在分 
析多元表格时将变得特别犀利，因为即便每一个表格随着它们的层级或者尺度 
的不同而彼此不同，关联性的基本模式或者结果仍能保持一致。 

我们有许多可用以探索不同类型的关联性模式或结构的模型。例如，拓扑 
模型、对角模型和交叉模型 （ Goodman ，1979 b 、 1985； Hauser , 1978； Hout ， 

1983)。 为了节省篇幅，本书将集中讨论模型家庭中特别的一支——关联模型，它 
们提供了强大且灵活的方式来模型化基本的关联模式。事实上，在众多不同的、提 
供令人满意的拟合程度的统计模型中，相对于其他竞争者，关联模型通常可以简约 
又利落地诠释变量之间的关系。而且，这些关联模型可以轻易地扩展至高维多元 
交互表格的分析，这些表格在社会科学的应用中尤其有用。 

一维关联模型 

关联模型可以分成两种 类型: 功能形式和维度或复杂度。前者可以取对数 
线性、对数增量或者混合方程形式，而后者可取一维、二维或者多维形式。当 
然，结合对数线性和对数增量规范的混合方程在定义上至少是二维的。尽管关 
联模型通常被称为“定序模型”，但是它们可用以分析定类或者定序的交互表。 
换言之，本书讨论的关联模型可更广泛地应用于定类一定类、定类一定序和定 
序一定序变量。另一方面，如果我们假设一个单向关系，即（观察的或者估计 
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的)行和/或者列数值是单调递增或递减的，关联模型就可以转换成真正的定序 
模型。要做到这一点，我们可以加人顺序或者不等式约束，令所有观察的或者 
估计的行和/列数值按照一个恰当的顺序排列 （Agresti & Chuang , 1986； 
Agresti，Chuang 8^ Kezouh ，1987； Bartolucci Forcina , 2002； Galindo - 
Garre Vermunt , 2004； Ritov & Gilula , 1991)。 在之后的例子中，我们将解 
释这些加入约束的情况。 

为了理解关联模型不同形式之间的主要差异，重要的是通过检查类别间是 
否存在指定/非指定的顺序以及类别间是否存在指定/非指定的间距来识别它 
们彼此间的差异 ( Goodman ， 1985:表 2. 2)。例如，如果行和列变量的类别都具 
有指定的顺序和指定的间距，令行效应模型为 ( R ) ，而列效应模型为 ( C ) ，尽管对 

数线性行与列效应模型 (R + C ) 也是适合的，但描述基本关联情况的最简约模 
型将会是一致性关联模型 ( U ) 。 

如果类别间存在非指定的顺序和非指定的间距，那么，对数乘积行与列模型 
效应 ( RC ) 是唯一适合的模型。正如表 2. 1中指岀的，这两个条件的不同结合会导 
致不同的模型设定。如果几个模型都提供了令人满意的结果，我们就必须在选择 
诠释关联性的最终模型时，权衡模型准确度和科学简约性的相对重要性。我们稍 
后将在模型选择部分讨论一些常用的策略。此外，通过以上表格中呈现的关系，我 
们可以理解为什么这些模型同属于关联模型以及它们之间的系统关系。 


表 2. 1关联模型中关于类别间顺序和间距的假设 


模型 

非指定排序 

指定排序 


非指定间距 

指定间距 

0 

行和列 

— 

— 

U 

— 

- 

行和列 

R 

行 

行 

列 

C 

列 

列 

行 

R + C 

— 

— 

行和列 

: RC 

行和/或者列 

行和/或者列 

— 


资料来源 : Goodman ， 1985: 表 4 A 。 
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单一性关联模型 

当行与列变量的类别的顺序和间距已经确定或者被认定时，我们有可能只 
使用一个自由度的关联模型来描述其中涉及的关联情况。这种模型被称为“单 
一性关联模型，’ ( u )( Duncan ， 1979； Goodman , 1979 a )。 假设 Ui 和 V ;是行 ( A ) 

和列 ( B ) 变量固定的整数值，即 U = 1，…， I 且兄=1，…， J 。 这个单一性关联 
模型 OJ ) 可以正式地表达 如下： 

log Fu = X + + Xf + (3 UiVj [2. 7] 

这里， p 是单一性关联参数。需要留意的是，这里为了说明这个模型与其他稍后 
讨论的关联模型的关系，它被有意写成这种形式。当使用先验数值时，公式 2 . 7 

便被称为“广义单一性关联 ( u 。) 模型” (Goodman ， 1986 、 1991 ; Hout ， 1983) ，等 
同于哈伯曼 (1978) 的线性相关关联模型。这个模型拥有 ( I - DO —1) - 1 = 
^ — ^ — ^[个自由度。为了简化起见，让我们假设使用了固定的整数值，那么，相 

邻的优比可以简化如下： 

log 0 ij = p ( Un-i — Ui ) ( Vh-i — Vj ) = p [2.8] 

因为 Uw — U = Vw —兄 =1 。在 U 模型中，连续的行是等距离的，连续的列也 
是等距离的。要注意的是，如果卩和兄不是固定的整数值，那么，公式 2. 8中的 
关系就不可以被简化。在任意一种情况下，如果 U 或者 U ° 模型同样好地拟合 
了数据，我们就可以通过一个单一参数而获得一整套的相邻优化。在本书中讨 
论的所有关联模型里， U 模型是最简约同时也是最受限的一个。 

行效应模型 

当只有列变量可由固定的整数值表示顺序和间距时，公式 2 . 7 便成为行效 
应模型 ( R )。 从代数上看，行效应模型可以表达如下： 

log Fij = X + Xf + Xf + rf 1 Vj [2. 9] 

要注意的是，这里只有（ I 一 1)# 个参数可以被确定。为了确定所有的 < 参数， 
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我们可以强加一个约束，即 T f = 0或者= 0。因此， R 模型拥有 (1—1) 

(J-l)-(I-l) - (I一 1)(J 一 2) 个自由度。这个模型被称为“行效应模型，，的 
原因是，所有涉及与行卩相对的行 i 的相邻优比是相同的，我们可以对行效应参 

数进行排序来表 7K 关联程度的强弱差异。后者的说明有助于更好的理解，因为 
相邻优比可以表示 如下： 

log 0ij = (r^ — ) (V m — Vj ) = — rf [2. 10] 

列效应模型 

当只有行变量可由固定的整数值表示顺序和间距时，列效应 （C) 模型可以 
表述 如下： 

log Fij = X + Xf + Xf + rfUi [2. 11] 

同样，这里可以被个别确定的只有 (J —1) 个参数。为了确定所有 T f 个 

参数，我们可以强加一个约束，令 rf = 0或者 2 rf = 0 o 这个列效应模型拥有 

( I - lKJ - l )-( J - l ) = ( I -2 KJ -1) 个自由度。在列效应模型中，所有涉 
及与列/相对的列 j 的相邻优比是相同的，因为相邻优比可以表示如下： 

log 0ij = — rf) ( Uh-i — Ui ) = T ^! — zf [2. 12] 

对数线性行与列效应模型 

为了同时充分利用行与列变量指定的间距和顺序等信息，我们可以设定一 
个模型，通过列与行变量之间指定的间距同时计算行效应和列效应。因为行效 
应与列效应是对数相加的，所以这种设定的统计模型被称为“线性行与列效应 
模型” (R + C)。 当古德曼 （1979a) 首次公式化这个模型时，它被称为 “ RC 关联 
I模型”，与性质上是对数相乘的 rc 关联 n 模型截然不同。在古德曼后来的著 
作中去除了这种语义上的差别 （Goodman， 1985、1986、1991)，而且它们现在 
一般区分为 R + C 和 RC 模型。从那时起，这种区分在实证研究者中一直保留 
着。从代数意义上来看，对数线性行与列效应模型 (R+C) 可表达 如下： 
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log F i} = X + Xf + Xf + V , + rfUi [2. 13] 

值得注意的是，不像之前讨论过的行效应模型和列效应模型，以上模型在 
公式 2. 13中只拥有 （I — 1) t ^ 和 （J — 2) rf 或者 （I — 和 （J — 1) rf 个可以同 

时确定并且各不相同的参数。在前面的情况下，我们可以强加一个约束4 = 
rf =rf = 0 o 除了令= 0外，正态化 D = 0也是可能的。在后面的情况 
下，正态化 rf = rf = rf = 0同样可以获得此特殊状态下的每一个参数。同样， 
除了令4 = 0外，采用正态化2 rf = 0也是可能的。总而言之 ， R + C 模型使 
用比独立模型多岀的一个额外 I + J -3 参数，并且它拥有 （I — 2 )(J — 2) 个自由 
度。最后，我们可以将 R + C 模型改写 如下： 

log F ;j = X + Xf + Xf + pUiVj + TfVi + rfU [2. 14] 

为了在公式 2. 14 中独特地确定每一个行与列效应参数，正态化 rf = rf = 
rf =疗= 0是必须的。在这种表达形式下， U 、 R、C 和 R + C 4 个模型彼此相 
关就更显而易见了。 

在公式 2. 14的基础上 ， R + C 模型中相邻优比的对数可以表达 如下： 
log 0, = pcu ^- u ) ( V m - 兄 ）+ (^ — ) ( V m — Vj ) 

+ ( r ^ 1 - rf )( U ^ 1 - U i ) [2 - 15] 

=P + ( t^i — rf ) + ( r^-i — rf ) 

例如，在同类婚姻和代际阶级流动的研究中，当行与列变量是一一对应的， 
为行与列类别数量相同的正方形表格时，我们可以强加更加简约的模型，使得 
同样类别中的行效应参数 (<) 等于列效应参数 ( T f )。 后者被称为“相等的对数 
线性行与列效应” (equal R + C ) 模型，而且拥有 （I — 1)(1 一 2) 个自由度，因为 
1 = Jo 因为关联模型的底层结构事实上是对称的，相等的 R + C 模型就成了准 
对称 ( QS ) 模型的一种特殊形式。同样，适用于行与列类别一一对应的正方形表 
格的一致性关联模型也符合 QS 的情况。 


对数乘积行与列效应模型 


不同于之前提到的关联模型，它们在行或者列类别的指定顺序和间距上作 
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岀明确假设，最后一种一维关联模型放松了这种假设。相反，这种模型试图从 
交互表中找出的关联模式里实证地推导出行与列的数值。它假设行与列的数 
值参数在对数双线性或者对数乘积形式中是彼此相关的 （ Andersen ， 1980、 
1991; Goodman , 1979 a 、1981 b 、1985； Haberman ，1981)。 从代数意义上来 
看， RC 模型可以表示 如下： 

log Fij = X + 入 f + 入 f + [2. 16] 

它服从于正态约束2 ~ = ◦和 X ； = ^ jVj 2 = 1 ( Goodman , 

19 7 9 a )。 这些约束分别称为“集中”和“缩放约束”。与 R + C 模型相似的是 ， RC 
模型拥有 （I —2 )(J — 2) 个自由度。 

以上的约束导致对行数值参数(^)和列数值参数 Q ) 的非权重或者单位标 
.淮化解决方法。其他正态化约束同样可以被用来确定这一模型。例如，古德曼 
(1981 b ) 建议就它们的边界权重方面对行与列的数值进行加权，使 RC 模型与经 
典的相关性计算方法相互关联。即 SiMiPi = = 0和= 

= 1，这里的 Pi 和 Pj 分别是行与列的边界概率，而作为结果的行与列 
数值参数则表示边界加权的解。我们还可以加上另一组约束：= 1、叫= I 、 
w = 1和 w = J ， 以确定 RC 模型。然而，对于单一表格分析而言，对不同约束的 
采用不会以任何显著的方式影响对结果的解释。然而，在分析多元交互表时，尤其 
是那些涉及组变量的表格，对不同权重的选择会导致完全不同的结果。跟从克洛 
格及其同事的推荐 (Becker Clogg ， 1989； Clogg 8^ Rao ，1991； Clogg Shiha - 

deh , 1994) ，更好的办法是采用有助于比较的单位标准化权重。 

RC 模型中行与列和幻数值可以被看做二变量常态数值和/或者作为 
最大化行与列变量之间的内在关联性。因为后者的解释，+被称为“内在关联参 
数”，并且当行与列数值参数是同一单位长度时代表关联强度。不同于其他统 
计方法，如皮尔逊相关系数 （ r )，<)> 值总是大于0而且趋于无限（如0 < <}> < 
oo ) 。[ 1] RC 模型最重要的性质可能是行和/或者列中的任何交换都不会影响估 
计数值参数的值。当研究者并不确定类别之间确切的排序和距离时，这一富有 
吸引力的性质意味着他们可以获得经验上的类别之间的排序和距离。同样，当 
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行与列变量之间存在——对应的关系时，我们同样可以通过设定对于所有 
i = j， 都有^ ^这一条件来估计相等的对数乘积行与列效应模型。与相等的 

R + C 模型相类似的是，相等的 RC 模型拥有（I 一 1)(1 一 2) 个自由度，而且是 
QS 模型中的一种特殊情况。 

要注意的是，每个变量类别内在的顺序是由我们感兴趣的变量的联合分布 
模式中的顺序决定的。准确的排序依赖于相关的或恰当的变量的引入。因此， 
更合适的做法是将“内在”顺序表述为“外在的”或者“依据外在情况而变的”顺 
序 ( Goodman ，1987:530) ，例如，当我们选择不同变量作为列变量时，行变量的 

顺序将出现变化，反之亦然。 

公式 2. 16可以重新表达 如下： 

log Fij = X + Xf + Xf + n* vf [2. 17] 

对于任意 y 和 S， 都有〆 = 和 vf 二^> 6 内，只要它们的和等于1，即 

y + S = 1 [2.18] 

在这个重新公式化中，对于 < 或者 < 而言，仅仅需要一个尺度约束。当 
7和5都等于 0.5 时卞卩 和 < 分别被称为调整的“行”与“列”数值，并且它们通 
常报告在 CDAS 和 £ em 中。这一重新设定提供了以图像形式呈现 RC 类型模型 
的有效方式(详情见后面的例子）。 

在 RC 模型下的期望相邻优比的结构可表示如下： 

log 0ij = ) ( Vj-H — Vj ) [2. 19] 

与之前的关联模型相比，期望优比的隐含结构将更加复杂。因为 P 和 Vj 都 
是参数，公式 2. 19中的这一乘项并不能进一步简化。 R + C 模型中的 [Uj ， Vj_ 
与 RC 模型中的 [ Ml ，vj 之间最大的差异是前者使用固定分配的（整数）数值，而 
后者采用由经验数据估计而来的数值参数。 

因为 RC 模型在性质上是对数乘积式的，所以我们建议反复运用牛顿的一 
维算法来估计所有关联参数4、^和 v,)。 通过每一次的计算循环，这一方法估 
计其中一组参数(如 p) 的同时，保持其他组参数(如今和幻为固定数值。当从 



现有的行和之前的循环中得到的估计值(似然比检验统计值或者参数估计值) 
的差异小于预先指定的小数值收敛标准时，这一方法便会产生最大似然估计。 
使用 R 软件新引入的功能来估计广义非线性模型 （Turner & Firth , 
200 7 a 、200 7 b ) ，我们得以通过改进的或者稳定的牛顿辛普森算法同时估计关联 
参数和它们的渐近标准误 （ Ait - Sidi - Allal，Baccini & Mondot , 2004 ； Gilula & 
Haberman ，1986； Haberman , 1979、 1995)。 除非特别强调，否则本书中提到 
的所有关联参数的标准误都是直接从 R 软件中计算获得的。它们的参数估计 
值原先从另一个功能估计得到，并且通过 R 完成检验。如果由于模块 
当前具有的局限性而无法直接计算标准误，那么将转而报告自举标准误。 

从上述的讨论中，我们可以看到， O 、 U 、 R 、 C、R + C 和 RC 模型（和在下 
面章节中提及的更加复杂的关联模型）之间存在系统关联性。根据古德曼 
(1981 a 、1981 b 、 1985、 1991) 的著作， RC 关联模型可以被当做离散化二元正态 

分布的近似法，然而，当除了第一行以及最后行间距和第一列以及最后列间距 
外，离散化二元正态分布拥有等长的行间距和等长的列间距时，我们可以使用 
U 关联模型。当使用边际权重而不是非加权关联模型时，这种解释是相当正 
确的。 

假设没有必要处理二维或更高维的关联模型时，一般的模型化策略是比较 
以上模型在相对自由度下的拟合优度统计值。根据 LRT 的计算方法，两个(嵌 
套)模型的拟合优度统计值的差异会服从自由度等于这两个模型自由度的差的 
渐进 x 2 分布。同样，通过卡方统计值的分割，实证研究者可以设计一种关联表 
格分析法 ( ANOAS ) 来解释每个要素的相对贡献(单一性关联、行效应、列效应 
和行与列效应）。关于分割方法的细节可见本书的解释例子。感兴趣的读者也 
可以通过古德曼 （1979 a 、1981 a ) 和克洛格等人 （1994) 的著作了解相似的分割 
方法。 

二维关联模型 

如果以上所有的一维关联模型都无法很好地拟合数据，我们就可以通过加 
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人额外的交互项来增加模型的复杂性。在关联模型的框架内，我们一般有两种 
选择。由于关联结构可以通过对数线性或者对数乘积要素而获得，所以其中一 
个选择是同时加入两种要素，这将生成 4 种特定的二维关联模型 （U + RC 、 R + 
RC 、 C + RC 和 R + C + RC )。 这些都是混合模型，虽然它们与那些在检验行与列 
变量关联性时，同时加人了垂直和非垂直效应的模型略有不同。另一个选择则 
只需在 RC 模型中简单地加入另一个维度，生成 RC (2) 模型。需要强调的是，这 
两种方法的选择要从实证和理论上考虑，并且依赖于它们相对的拟合优度、理 
解的容易程度和实质的解释程度来进行判断。 

U + RC 模型 

第一种二维模型结合了两种要素 :在同 一个模型中加入单一性模型 （ U ) 和 
对数乘积行与列效应模型 ( RC )。 生成的 U + RC 模型可以表述 如下： 

log Fij = X + + 入 f + < j>iUiVj + 令 2/iiVj [2. 20] 

需要提醒读者的是，单一性关联模型参数现在表示为 f 而不是 Pi ，并且 RC 
要素中的内在关联性和显示出，这是一个二维关联模型。如往常一样，为了唯 
一地确定 p 和 Vj ，需要同时加入集中和尺度约束。这一模型拥有 IJ — 21 — 2 J + 
3个自由度，并且相邻优比的对数可以由以上两个要素组成： 

log 0 ij = 令1 + ( fJLH-1 — fJiiHVrhl — Vj) [2. 21] 

我们可以通过比较 U + RC 模型与那些 U 和/或者 RC 模型的拟合优度来 
评估是否真的需要额外的关联维度。这一对比同样允许我们详细检查公式 
2. 20中每一个要素的相对贡献程度，并评估主要的关联维度在性质上是对数线 
性的还是对数乘积的。 

R + RC 模型 

除了使用单一的单一性关联参数，我们可以用行效应参数和固定整数的列 
数值(兄)替代它。这会生成一个稍微有些复杂的混合模型，并且 R+RC 模型可 
以表达 如下： 



198 


列表数据分析 


log Fij =人 + 入广 + 入 f + rf Vj + (j> 2 in Vj [2. 22] 

这里的#代表行效应参数。不同于一维模型，我们需要两个约束才能确定所有 

的# 参数（如 T f = Ti a = 0) 。另一方面，我们需要相同的集中和尺度约束来确定 
p 和…因此，这一模型拥有 （I —2 )(J — 2)_(1 — 2) = (I — 2 KJ — 3) 个自由 

度。通过比较当前模型与相对简单的一维模型的拟合优度，就可以判定这一更 
加复杂的模型是否与数据一致。当两种要素明显有助于我们的理解时，我们应 
该选择这一复杂模型而不是简单但错误的形式。最后，相邻优比的对数包含两 
大要素，即对数线性和对数 乘积： 

log 0ij = — rf) + (f >2 (jLtffi — p) (Vj +1 — Vj) [2. 23] 

C + RC 模型 

除了假设公式 2. 22 中存在行效应，我们还可以用列效应(<)和固定整数的 
行数值 ( U ) 替代它们。生成的模型成为了 C + RC 模型，即 

log Fij = X + Xf + 4 - rfUj + <|> 2 ^iVj [2. 24] 

另外，同样需要两大约束来确定所有 if 参数（如= irf = 0) ，并且模型拥 
有 ( I -2)( J -2)-( J -2) - (I — 3 )(J — 2) 个自由度。同样，相邻优比的对数 
同时包含对数线性和对数乘积要素，即 

log 0ij — (— rf) + 和 （ /jti+i — /xj) ( Vj+i — Vj) [2. 25" 

每一个要素的相对贡献可以通过 AN()AS 分割方法与其低阶要素进行比较。 

R + C + RC 模型 

另一种混合模型同时结合对数线性行与列效应 （R + C ) 和对数乘积行与列 
效应 ( RC )。 生成的 R + C + RC 模型可以表达 如下： 

log F.J =x + X, A + Xf + ^ UVj 十 Tl A V J + T fU i + [2. 26] 

为了唯一地确定对数线性行与列效应参数，需要对 T ; 〜 或者/ 参数额外增 
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加一个约束。例如 ， rf = T2 = rf = rf = r ； = 0或者 rf = rf = q = r 2 = 
4 = 0。因此，这一模型拥有 （ I —1 )(J —1) —(I + J —5) —(I —2) —(J —2) — 
1 = (I — 3)(J — 3) 个自由度。相邻优比的对数具有以下结构： 

log ft ) = ^>i + ( th-i — rf ) + ( r^-i — if ) + 扣（阳 — fii ) ( vh-i — Vj ) [2. 27] 

RC (2) 模型 

最后一个二维关联模型去除了对数线性项，代之以另一个对数乘积要素。 
它被称为 “ RC (2) 模型” ，括号内的数值表示对数乘积要素维度的数量。模型表 

示如下： 


log Fy = X +入广+入 J 3 +今 1 叫冲+ <(> 2㈣ 作 [2.28] 

并且相邻优比的对数具有以下结构： 

log 0ij = ^>1 (/jti+ 1 , 1 — fJLil ) (vj+l, 1 — Vjl ) + </>2 2 — ㈣ ）（ Vj+1’ 2 — Vj 2 ) [2. 29] 

与 R + C + RC 模型相似，它同样拥有 （I 一 3) (J — 3) 个自由度。除了为行和 
列数值参数（叫、叫、 v n 、 v j 2 ) 加上集中和尺度约束外，即它们的总和等于 0 
而且平方和等于1，我们还需要额外的跨元交互约束来确定所有参数。它 

们的表述如下： 

= X ) l =1 VjiVj 2 = 。 C 2. 30] 

换言之，矢量叫和叫构成了一个标准正交基，矢量冲和吨也是如此。如果 
行与列类别是——对应的，那么，对其中一些类别（如果不是两个维度上所有的 
行与列数值)加上等同性的约束将会很有趣，例如，仅对于第一维度中的所有 
i = j ， 有 Mil = Vjl 。当然，当相等的行与列数值强加于两个维度时，基本的关联模 
式将会是对称的，而且隐含着 QS 模型。如果用两组先验的固定行数值 [ Uu ， 
v ^] 和列数值[认， V ; 2 ] 替换[叫，冲]和[叫， V j 2 ] ，这一模型可表示为 u ?+ u “ 
这与豪特发展的 SAT 模型有着强相似性，只是他的形式更加复杂。后者事实 
上就是三维和高维模型，并且包括对角单元格的额外效应。到目前为止，显而 
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易见的是， u?+u° 事实上是 RCX2) 模型或者 RC(M) 模型(在后面的章节会加 
以介绍）的一个特例。因为 RC(2) 模型要求跨元交互约束，一些读者可能会倾 
向于使用混合模型，因为后者可以从标准的统计软件中轻易估算得到，而只有 
少数的统计软件具备分析跨元交互约束的功能。尽管如此，当我们不想强加任 
何类别间先验的顺序，而且我们对获得经验的分数估计值感兴趣时， RC(2) 模型 
依然具有吸引力。并且，因为它将在涉及多元交互表的第 4 章中举例说明，所以 

在特别的情况下，我们没有必要对一些 RC(2) 模型或相关的、具有复杂设定的 
模型强加跨元交互约束。 


多维 RC ( M ) 关联模型 


尽管我们可以在三维或者高维关联模型中构建混合模型，但更有效的做法 
是将 RC(2) 模型推广至第 M 个维度上 （Clogg & Shihadeh, 1994； Goodman, 
1985)。[ 2 ] —般而言，多维 RC(M) 关联模型可以表述 如下： 

log Fij = X + + Xf + XI [2. 31] 

这里， 0<M<min(I-l, J — l)。 对于任意 M* <M, 这一模型都是非饱和的， 
而且拥有 (I-M-1KJ-M-1) 个自由度。当 M* = mind, J) 一 1 时，它便 
是饱和的或者变成 FI 模型。而当 M* = 0时，它等同于独立或者虚无关联模 

型。为了识别所有行与列数值参数，我们需要加上集中、尺度和跨元交互约束。 
例如，下列跨元交互约束是需 要的： 

= 0 [2. 32] 

在这里， m 关或者，尺度和跨元交互约束可以更简洁地表述 如下： 

= d mm ， [2. 33] 

这里的是 Kronecker 8(Becker, 1990 ； Becker & Clogg, 1989 ； Goodman, 
1985) 。 在这种设定下，完整的一套相邻优比对数具备如下 结构： 
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log 0 ij = 2^1 rn ^, ^ mC ^ H - l , m — ptim)(Vj+l, m - Vj m ) L 2. 34 J 

在不损失一般性的情况下，我们可以重新排列内在关联参数 ，如扣 > 
j>2 0 o 

这样，我们就可以将公式 2. 31 重新表述 如下： 

* 

log Fij = X + Xf + Xf + 2 m=1 [2. 35] 

这里有 〆 m = , Vj ； - 仏 v jm 和 y + S = l 0 在公式 2. 35 中，至少存在 3 种可 

能的正态化方法用以确定 <和 v 「 m 。 它们分别是行为主正 态化： 

/^im ~ Vj m — Vj m [2. 36] 

列为主正 态化： 

fJ-im = /^im 9 Vj m — <j) m Vjm [2. 37] 

对称正 态化： 



"2. 38" 


就大多数实用情况而言，通常会选择最后那种方法，因为它在正态化上并 
不偏好于行或列 (Clogg & Shihadeh ， 1994)。而且，从对称正态化中估计而来 
的行和列数值在图像展示中十分有用，这样有助于我们理解从不同维度估计而 
来的行和/或者列数值是如何彼此相关的。 [3] 


各种关联模型间的关系 

通过以上讲解，读者可能已经发现 U 、 R 、 C 、 R + C 、 RC 及它们更高阶的模 
型彼此之间具有系统关系。例如，你们可以在公式 2. 9行效应模型下重新表述 
行效应参数 (#): 

# = [2.39] 

通过对整体效应提出因子，加上如下 约束： 
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S: =1 C =0和 =k [ 2 . 40] 

这里的 k 是任意常数，如1或者 I 。在这种重新设定中，依然存在 (1-1) 个非多 
余的 参数 ： a — 2) 个 f 和1个 r 。 因此，单一性关联模型可以被看做当对于所 
有的 i 而言，有 C = 1时， R 的一种特殊情况。同样，列效应模型可以重新看做 
包括两大 要素: r 和，而且单一性关联模型同样也是 c 模型的一种特殊情 
况。另一方面， r 和 c 模型彼此之间并不存在系统关系。此外，通过比较公式 
2. 9、公式 2. 11、公式 2. 13和公式 2. U ， 读者可以理解为什么 R 和 C 模型可以 
被看做是 R + C 模型的特殊情况。 

那么， R 和 RC 模型之间的关系是怎么样的呢？假设 Vj = Vj ， 通过固定整 
数数值， RC 模型可以重新表达 如下： 

log Fij = X + 入 f + 入 f + Vj = + xf + V* rf [2. 41] 

这里有 V / =兄和/ =</^。在这种表述中，当连贯的列之间等距时， R 模型便 
是 RC 模型的一种特殊情况。岀于同样的原因，当连贯的行之间等距时， C 模型 
也是 RC 模型的一种特殊情况。最后，当连贯的行与列之间都是等距时， U 模型 
同样是 RC 模型的一种特殊情况。另一方面， R + C 模型和 RC 模型之间并不存 
在直接关系。 

关联模型家族间的系统关系同样可以扩展至高维度模型。例如，如果 
RC ( M ) 模型的第一维度中的行与列数值可以表述为固定整数数值，即~ = 
u u 和 Vji = V n ，那么，这个模型便等同于 U + RC ( m * ) 模型， m * = 1，…， 
M — 1。岀于同样的原因，只有当 Vjl = V n 时，我们可以将 RC ( M ) 模型重新表 
述为 R + RC ( m * ) 模型； 而只有当忤= Uu 时，可表述为 C + RC ( m * ) 模型； 
当叫= Ui !、 冲 =%而它们的效应以相加形式出现时，可表述为 R + C + 
RC ( m *) 模型。 

最后，如果 M 组先验数值被用于行与列类别，那么， RC ( M ) 模型可以表述 
为 U °( m ) ，这里的 m = 1，2 ，…， M 或者 U 。 （ 1) + … + U Q ( M ) ( Hout ， 1984、 
1988)。为了举例说明，图 2. 1展示了各种一维和二维关联模型的图形关系 
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( Goodman , 1985)。 


关联模型 
O 



自由度 

(I-1KJ-1) 

U-1-J 

(I-1KJ-2) 

(I-2KJ-1) 

(I-2KJ-2) 

IJ-2ICJ-2) 

IJ-2I-2J+3 
(I—2KJ — 3) 
(I-3KJ-2) 
(I-3KJ-3) 


注 : 当 1 = 2 或者 J = 2 时，关于自由度计算方法可能不适用。 

资料来源 : Goodman, 1985 :图 1 。 

图 2.1 适用于 IXJ 表格的关联模型之间的关系示意图 


模型估计、自由度和模型选择 


现在的一些统计软件都可以用来估计关联模型。它们包括 CDAS 3. 50 
( Eliason , 1990 )、 fevi 1. OCVermunt , 1997 )、 GLIM 4. 09 ( Francis , Green & 
Payne , 1993) 和 R ， 特别是 功能 （Firth & Menezes , 2004； Ihaka & Gentle ¬ 
man , 1996 ； Turner Firth , 2007 a 、2007 b )。 CDAS 、£ em 和 R 都是免费软件， 

可以从网上下载并安装到大多数个人电脑上。 [4] 其中一些关联模型还可以通过 
用户手写的独立程序或者 SAS 、 STATA 中专门的模块进行估计。在我们所举 
的例子中，所有模型都是从 GLIM 或者 R 软件中估计得来的，并且它们的 
输入输岀文件均可从 Sage 岀版社网站上下载 （ http : // www . sagepub . 



com / - / index , htm ) 。一般而言，基于运行速度和使用简易程度的考虑， 

是我们的首选软件。然而，由于 〖 em 的目前版本并不能为多维 RC ( M ) 关联模型 
RC ( M ) 提供跨元交互约束，所以这些模型必须通过 GLIM 中的使用者手写的迭 
代程序进行估计，这一程序可以提供格拉姆一施密特正交化约束 （ Wong , 
2001 )。 我们同样可以从 STATA 中的 RC 2 和 MCLEST ado 程序估计 RC 模 
型，并从哈伯曼 (1995) 编写的独立 DASSOC 程序中估计 RC ( M ) m 模型。[ 5 ]遗 
憾的是，这些用户手写程序也存在局限 :它们 仅限于双向表，并不能扩展至多向 
表。幸运的是，大多数估计上的问题现在已经被解决了，因为有学者 (Turner & 
Firth ， 2007a 、 2007b) 在 R 软件中新近引入了广义非线性模型 （以 ^) 模块 。[ 6 ] 

后者很可能在未来成为公认的统计工具，因为它的灵活性可以提供各种类型的 
约束，并且同时可以获得渐进标准误。 

在估计 RC 类型的关联模型时，一个主要的问题是，似然函数偶尔会出 
现多个局部最大值。这一问题很可能出现在拟合较差和约束复杂的模型 
中，尤其是那些涉及多向表的模型。在这种情况下，设定的模型可能无法恰 
当地收敛。这时，我们一般可以采用两种方法解决这一特殊问题。第一种 
策略是使用多个随机初始值来确保所有参数估计值收敛于相同的数值（例 
如，直到第四位数）。第二种策略是将默认收敛标准（如在 4 m 中为 
0. 000001) 设定为更小的常数，如 0. 0000000001。因为似然性在降低，所以 
导致的问题是，这套运算法可能在仅完成部分重复计算后突然停止。这种 
情况经常发生在不佳的初始值或者这个模型过于复杂以至于无法恰当地进 
行估计时。前者的问题有时可以使用随机初始值来解决，而后者的问题最 
好的解决方法是精简模型。 

一般而言，一个模型自由度的计算是将所有单元格的数量减去特定模型中 
确定参数的数量。然而，在多维关联模型中，因为存在或者缺乏跨元交互约束， 
对于参数数量的计算常常出问题。正如我们在下一章中会看到的，某些约束过 
多的 RC ( M ) 模型常常面对这个问题，当它们其实并不需要或者只需要部分可 
行的跨元交互约束时。我们在第3章和第4章中将提供关于这些情况的更全面 
的讨论。无论如何，如果我们知道使用的跨元交互约束的数量，那么，自由度便 
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可通过如下公式计算： 

df =单元格数量一(参数的数量一约束的数量） 

=单元格数量一参数的数量+约束的数量 

此处需要强调，计算一个模型自由度的知识是十分关键的，因为对于某 
些模型而言，现在可用的统计软件，如 CDAS 和 & m ， 所报告的自由度是不正 
确的。另一方面，基于适当的条件， R 在大多数情况下可以提供正确的自 
由度。 

通过一系列关联模型和/或其他竞争性模型的估计，我们必须发展岀有关 
模型选择的一套系统方法，才能最好地描述基本的关联模式。理论上需要考虑 
两个因 素:模 型准备度和科学的简约度。在所有方面都相等的情况下，我们应 
该采用奥卡姆剌刀原理 (Kotz & Johnson ， 1985:578—579 )。 假设 E 表示观察 
证据，并且 p(H | E ) 表示给定观察证据 E 时一个特定假设 H 的概率，那么这一 
原理可表示 如下： 


p(Hi I E) = p ( H 2 丨 E)= … = p ( H k I E) [2. 42] 

对于假 设 Hi ，…， H k ， 其中最简单的那个假设便是我们的首选。然而在实践 
中，尤其当样本量变得很大时，模型准确度和科学的简约度经常被理解为一种 
权衡。例如，研究者甚少有如下表述：“对于小样本，我们通常可以找到拟合 
程度令人满意的模型；而对于大样本，没有模型可以拟合。” （ Goodman ， 1991： 
1085； Berkson , 1938； Diaconis Efron , 1985) 或者：“我们的结果（大样本) 

是消极的，不管我们尝试的模型是什么，我们总可以找到显著偏差以至于我们 
不得不拒绝这 一 模型。 ” （ Goodman， 1991 : 1085 ； Fisher, 1925 ； Martin-Lof , 
1974) 

实证研究者还是可以找到许多不同的方法来处理大样本中模型拟合度相 
对贫乏的问题。在这些方法之中，贝氏信息准则 （ BIC ) 统计方法也许是理论上 
最优和使用上最广泛的一种方法，辅助研究者选择竞争模型。 BIC 统计值起源 
于贝氏后验检验理论 ( Raftery ， 1986、 1996) ，并且可以通过下列公式计算 得到： 



BIC = L 2 -dfMogN [2.43] 

这里的 L 2 表示对数似然拟合优度检验统计值， df 表示一个模型的自由度，而 N 
则表示样本量。 BIC 统计值的一大优点是，它可以被用来比较嵌套或者非嵌套 
模型。[ 7 ]一般而言，当在各种竞争模型中进行选择时，我们会选择 BIC 统计值为 
最大负数的那个模型。同时，有学者 ( Raftery ， 1996； Wong , 1995) 提醒道， BIC 
统计值中细小的差异(如5点以内)是大样本的边际点。 

当 BIC 统计值的发展可能为我们提供了比其他统计值更可靠的方法时，也 
存在被实证研究者滥用的情况，尤其在只考虑有限数量的模型时。事实上，任 
何对 BIC 统计值不加区别的使用和相似的模型选择标准，都可能扭曲我们对复 
杂的基本关联模式的理解 ( Weakliem ， 1999)。简单地说，从一组不正确并且设 
定质量低的模型中选择错误最少的模型，根本无法提供一个可靠的策略。从不 
同的解释出发来公式化和比较不同的竞争性模型才是上策。 

虽然当设定的模型不正确时，样本量和关联强度可以显著地影响拟合优度 
和似然比检验系数，但我们必须承认，它们对“真实”模型及其邻近的过度参数 
化模型的影响是微不足道的 ( Wong ，2003 b )。 事实上，对于设定恰当的模型，对 
数线性模型(包括关联模型）的拟合优度统计值独立于样本量 ( Wong ，2003 b )。 
换言之，对于设定恰当的模型而言，名义检验统计值及嵌套卡方检验在模型选 
择中为我们提供了可靠的工具。 

以上的讨论阐释了在模型选择中两种不同的思想流派 ：贝氏 方法和经典的 
统计方法。与其将两种方法看做彼此对立的或者需要在两者之间作出取舍，更 
具意义的是将两者看做相互补充的。正如本书的各种例子展示的那样，只要我 
们小心谨慎地处理基本关联模式的各种竞争性形式，两种方法是可以得出一致 
结论的。 

渐进、刀切法和自举标准误 


尽管在估计 RC 类型关联模型时，我们首选牛顿的一维方法，因为它运算 



关联模型 


速度快且使用简单，但是它会产生一个不好的结果:这一程序并不为每一个对 
数乘积要素计算出渐进标准误。在牛顿辛普森算法的基础上，由哈伯曼等人 
(1986) 提出的交互计分计算方法通过同时计算参数估计值及它们相应的渐 
进标准误，从而巧妙地解决了这个问题。由于这一推荐的方法计算十分复杂 
而且并不总是产生收敛的估计值，哈伯曼 （1995) 后来发展出一个改良算法， 
可以有效地解决上述问题。不幸的是，这一算法的同伴 FORTRAN 程序—— 
DASSOC —局限于估计双向表的 RC ( M ) 模型，因此，它并没有在实证研究 

者中得到广泛应用。 

另一方面，亨利 （ Henry ，1981) 、克洛格等人 （1990) 建议使用刀切法来生成 
恰当的标准误。亨利 （1981) 和克洛格等人 （1990) 指出，对方差的刀切法估计与 
其他分析大样本的方法，如△法或者信息估计矩阵反函数相比，效果更好。刀 
切法可以轻易地应用在交互表的分析中。假设€表示总体参数，而 i 表示样本 
中相对应的最大似然估计。让我们进一步定义 I 为当第 h 个观察值被删除 
时，从样本中获得的数值。总体参数 ㉑I 以从基于所有 n 个观察值的最大似然估 
计中估计而来，或者估计 n 个重复样本的均值。后者可以表示 如下： 


八 n 八 / 

r = E h=1 ?h/n 

[2. 44] 

从结构来看 ， g * 总是等同于^。1或者^的抽样方差现在可以近似为方差的 

总和： 


/\ - -1 n 八 八 、 o 

s 2 ce ) = S h =1 ( s h — r ) 2 

[2. 45] 

对于列联表而言，刀切法估计是一个简单的加权平均数： 



[2. 46] 

方差则为加权平 方和： 



[2. 47] 


当然，以上数值的平方根便是刀切法标准误。 [8] 

刀切法重复的数量仅依赖于单元格的数量(如双向表中的 IX J 或者三向表 



中的 IXJXK )， 而不是观察值 n 的总数量。正如克洛格等人 (1994:37) 指岀的 
那样，刀切法不仅在“计算难以分析的数值的抽样方差（或者方差一协方差矩 
阵)中是有用的，而且在分析观察值的影响效应上也是有效 的”。 遗憾的是，后 
者的性质并没有被实证研究者加以发展和研究。 

尽管刀切法标准误容易获得，但是并没有学者尝试评价它在涉及渐进和自 
举标准误的各种类型的关联模型中的表现。基于本书中有限的例子和笔者个 
人的经验，各种关联模型的刀切法标准误一般是闭合的，但比从 GLIM 或者 R 
直接获得的渐进标准误稍大。 [9] 

另一方面，自举法的表现可以很好地与刀切法比较，只要自举重复样本的 
数量足够大，例如，10000或者更多。一般而言，自举法是一个非参数、计算复杂 
的统计推断方法 ( Efron ， 1981； Efron & Tibshirani ， 1993； Mooney & Duval , 

1993)。通过可替换初始数据的随机抽样，自举法可以建构统计值近似的抽样分 
布。我们将一些模型中具有50000个重复样本的自举标准误与渐进标准误进行 
比较，可以发现它们具有较高的可比性。与刀切法标准误的例子相似，自举标 
准误也比渐进标准误稍大，尤其对于内在关联 （ p 参数，尽管估计的行与列数值 
参数(/^和 Vj ) 的差异更小了。另外，对于那些高度参数化的关联，如果具备线性 
趋势约束的模型，这3种标准误将是等同的。 

一般而言，当可以从统计软件，如 R 中直接获得渐进估计时，我们建议同时 
报告渐进标准误。然而，当这些标准误不能直接获得时，如在涉及跨元交互约 
束的多维 RC ( M ) 关联模型中，我们应该转而使用刀切法或者自举标准误。由于 
刀切法容易执行，并且需要相对少的计算时间，它更常被选用。在本书中，如果 
可能的话，所有报告的标准误都是基于渐进标准误而来的。然而，当它们并不 
可获得时，我们转而报告基于50000个重复样本的自举标准误，但笔者强烈建议 
读者用刀切法的结果与本书展示的结果进行比较。 

空缺单元格和稀少单元格的问题 

在分析交互表中重复出现的一个问题是出现空缺单元格或稀少单元 
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格，研究者经常担心存在这一情况会系统地扭曲基本关联模式。空表格有 
两种 类型： 结构性空缺和抽样性空缺。结构性空缺的表格期望值为0,即在 
这些单元格中不存在观察值。前面这种情况的例子包括在进口和岀口交易 
表格中的对角性单元格或者一个不完整的表格。另外，当表格中的观察单 
元格是空缺的，但它的期望值并不等于0时，就存在抽样性空缺。抽样偏差 
可以解释观察空缺的出现。解决结构性空缺的方法很简单—封闭那些有 
问题的单元格并进行加权数据分析，再对每一个模型的自由度进行相应的 
调整。另一方面，对抽样性空缺的解决方法需要进行谨慎的观察，因为一些 
交互参数可能会变得不明确。一个常用的.做法是为每一个表格添加一个细 
小的常数（如 0. 50或 0. 10) (Bishop et al . ，1975 ； Goodman , 1972)。 克洛 

格等人 （1991) 则提供了一个稍复杂的方法为所有单元格获取交互参数。这 
种方法的后果之一是样本量会膨胀，这在稀少数据的情形下会变得十分显 
著。奇怪的是，当这一正确的方法被频繁使用时，它又会出现问题 （Clogg & 
Shihadeh ， 1994:17)。 

另外，空缺单元格的出现看起来并不会对关联模型造成任何大的问题。 
观察情况可以从笔者全面的敏感性分析而得到保证 （ Wong ， 2001)。相对于 
非调整的表格，对所有表格添加任意较小的常数，并不会显著地影响参数估计 
值。对于这种参数估计上的稳定性的合理解释是，这些模型是高度参数化的， 
且生成的关联参数是基于特定行和/或列的一组单元格而不是单个单元格计 
算得来的。当然，当行和/或列的边界单元格接近空缺时，这一情况仍然可能 
出现问题。 


例 2.1: —维关联模型 

第一个例子见表 2. 2( a )， 这是关于个体政治取向 （ POLVIEWS ) 及他们对 
性别分工的态度 （ FEFAM ) 之间的一个简单交互分类。政治观点变量是一个 
自我识别的政治取向测量，具有7个反应类 别：强 自由主义、自由主义、弱自由 
主义、中间取向、弱保守主义、保守主义及强保守主义。而性别取向变量询问 
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调查对象对如下陈述的同意 程度： “男人最好外出工作，女人最好照顾家庭 。” 
回答可分为 4 种类别 :非常 不同意、不同意、同意和非常同意。粗略的计算来 
自 D 98 年和2000年的综合社会调查，总共有3 4 39个个案。我们的兴趣是弄 
清楚对性别分工的态度是如何与个体的政治取向相关的。例如，我们能否说， 
一个人在政治上越保守（或者自由），他/她就越同意（或不同意）这一 （男女） 
“隔离领域”的意识形态？ 

表 2. 3 给岀了一系列关联模型，帮助我们理解两个变量之间的关系。当虚 
无关联或者独立模型(第一行)无法提供令人满意的结果时，表 2. 3 报告的其他 
所有的模型有了明显的改善，正如拟合优度和 BIC 统计值所表明的那样。例 
如，只使用1个自由度，单一性关联模型（第二行）就捕捉到了 POLVIEWS 和 
FEFAM 之间略大于 90% 的关联性，并且 L 2 / df 比率也只是稍大于1。[如由于 
对数线性行效应与列效应模型(分别为第三行和第四行)都提供了令人满意的 
结果，可以预料的是，比它们更加复杂的其他模型 （R + C 模型和 RC 模型，如第 
五行和第六行)同样可以提供满意的结果。 

这里所展示的所有模型是令人满意的，但在它们之中进行选择则是困难 

表 2. 2双向交互表的例子 


( a ) 政治取向与对性别分工的态度 （N = 3439) 


POLVIEWS 


FEFAM 


非常不同意 

不同意 

同意 

非常同意 

强自由主义 

39 

50 

18 

4 

自由主义 

140 

178 

85 

23 

弱自由主义 

108 

195 

97 

23 

中间取向 

238 

598 

363 

111 

弱保守主义 

78 

250 

150 

55 

保守主义 

50 

200 

208 

74 

强保守主义 

8 

29 

46 

21 


注: POLVIEWS : 自认为是自由主义或者保守主义。 
FEFAM :男人最好外出工作，女人最好照顾家庭。 
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( b ) 女性的教育和职业获得 （N = 3858) 


EDUC 



OCC 



高级非体力 

低级非体力 

髙级体力 

低级体力 

务农 

大学及以上 

518 

95 

6 

35 

5 

大专 

81 

67 

4 

49 

2 

高中 

452 

1003 

67 

630 

5 

高中以下 

71 

157 

37 

562 

12 


EDUC : 教育获得 

OCC : 职业获得 _ 

资料来源 ： U ) 和 ( b ) 的数据分别来自1998年至2000年和1985年至1990年的综合社会调査。 

表 2. 3 关于表 2. 2(a) (POLVIEWS X FEFAM ) 的关联性分析 


( a ) 适用于表格 2 . 2( a ) 的关联模型 


模型描述 

df 

L 2 

BIC 

A 

P 

1. O 

18 211. 70 

65. 12 

8.09 

0. 000 

2. U 

17 

20. 12 

-118.31 

2.77 

0. 268 

3. R 

12 

15.91 

-81.81 

2. 47 

0. 196 

4. C 

15 

14. 24 

-107. 91 

2. 32 

0. 508 

5. R + C 

10 

7. 68 

-73. 75 

1. 77 

0. 660 

6. RC 

10 

8.07 

-73. 36 

1. 77 

0. 622 

( b ) 表格 2 . 2( a ) 中的关联要素 

要素 

使用的模型 


df 

似然比卡方值 

一 * 般效应 

(1)-(2) 


18-17 = 1 


191.58 

行与列效应 

(2)-(6) 


17 — 10 = 7 


12.05 

其他效应 

(6) 


10 


8. 07 

总效应 

(1) 


18 


211.70 

( c ) 表格 2 . 2( a ) 中的关联行与列效应要素 

要素 

使用的模型 


df 


似然比卡方值 

列效应 

(2)-(4) 


17-15 = 2 


5. 88 

行效应 

(4)-(6) 


15 — 10 = 5 


6. 17 

行与列效应 

(2)-(6) 


17-10 = 7 


12.05 


注: BIC 表示贝氏信息准则，在这里， BIC = L 2 — dfXlnN ; A 表示相异指数。 
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的。假如通过奥卡姆剃刀原理，它们都可以提供关于变量关系的合理理解，那 
么，我们倾向于选择单一性关联模型和列效应模型。另一方面， BIC 统计值暗示 
着最简洁的模型优于稍微复杂的 C 模型。 

表 2. 3( b ) 和表 2. 3( c ) 的信息提供了两种不同的方式分解从不同模型中得 
到的拟合优度值，这可以帮助我们更好地理解各种要素间的相对贡献率。例 
如，表 2. 3( b ) 中的项目信息告诉我们，当单一'性关联参数捕捉到了拟合优度统 
计值方差中一个显著的比例时，我们不应该随便忽略从行与列效应参数获得的 
5. 7%的贡献 ( p <0. 10)。表 2. 3( c ) 的信息有助于检验行效应、列效应和行与列 
效应的相对贡献。由于 R + C 和 RC 模型在拟合优度统计值上的差异是微不足 
道的，所以从两者的计算中只能得到细微的差异。为了方便讲解，我们使用 RC 
模型作为比较的基准模型。当其他方面保持相同时，分解策略表明，只使用2个 
自由度，列效应参数就可以估计总体效应的29%(5, 88/20. 12)，而行效应参数 
则可估计另外的31%(6. 17/20. 12)。然而，后者使用了 5个额外的参数。换言 
之，在表 2. 3所展示的所有关联模型中， C 模型是最终选择的模型。 

表 2. 4不仅提供了在表 2. 3中得到的不同关联模型的参数估计值，而且还 
提供了期望的相邻对数优比，帮助我们更好地解释这些参数和这些参数所隐含 
的优比的基本结构。例如，单一性关联的估计值是 0. 202,并且所有期望的相邻 
对数优比都具有相同的数值(见公式 2. 8) 。对于行效应模型而言，估计的行效 

应参数将构建期望的相邻对数优比的结构。这里报告了两组参数，第一组采用 
了 2^ = 0的正态化方法，而第二组则使用 T f = 0的方法，但是它们生成了相 
同的预测对数优比。例如，预测的相邻对数优比第一行的项目可以比较第二行 

与第一行的情况，并且它们都具有相同的数值，即 0. 154,而且并不随着列情况的 
变化而不同。同样，当比较第七行与第六行时，所有项目都等于 0.253(0. 672 — 
0.419) (见公式 2. 10)。出于同样的原因，读者可以使用从 C 模型中得到的列效 
应参数来理解当与不同的相邻的列比较时，期望的相邻对数优比都等于相同的 
值，并且它们不随着相邻的行的变化而不同的情况。 

对于 R + C 和 RC 模型而言，对期望的相邻对数优比的计算是复杂的，因为 
我们需要同时考虑行效应和列效应。 [ H ] 
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关联模型 


期望的相邻对数优比 


(a) U 


估计参数 
单一性关联 

(b) R 


估计参数 


行效应 


替代性策略 


(c) C 


0. 202 
0. 202 
0. 202 
0. 202 
0. 202 
0. 202 

0. 202 

(0.015) 


0. 202 
0. 202 
0. 202 
0. 202 
0. 202 
0. 202 


4:3 


0. 202 
0. 202 
0. 202 
0. 202 
0. 202 
0. 202 


(0. 108) 
0. 000 


估计参数 


列效应 


替代性正态化 


— 0. 322 
(0. 026) 
0. 000 


0. 154 

0. 154 

0. 154 

0. 157 

0. 157 

0. 157 

0.257 

0. 257 

0.257 

0. 104 

0. 104 

0. 104 

0. 307 

0. 307 

0. 307 

0.253 

0. 253 

0. 253 

2 3 

4 5 

6 7 

-0. 405 -0. 248 

0. 009 0. 112 

0. 419 0. 672 

(0.059) (0.058) 

(0. 040) (0. 051) 

(0.051) (0.100) 

0. 154 0. 310 

0. 568 0. 671 

0. 978 1.231 

(0. 136) (0. 136) 

(0. 127) (0. 133) 

(0. 133) (0. 168) 

0.257 

0.203 

0. 112 

0. 257 

0. 203 

0. 112 

0. 257 

0. 203 

0. 112 

0.257 

0. 203 

0. 112 

0.257 

0. 203 

0. 112 

0. 257 

0. 203 

0. 112 

2 

3 

4 

22 一 0. 065 

0. 137 

0. 250 


( 0 . 020 ) 
0. 257 
(0. 035) 


(0. 023) 
0. 459 
(0. 039) 


(0. 034) 
0. 571 
(0. 053) 
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(续表) 


关联模型 


期望的相邻对数优比 


2:1 

3:2 

4:3 

( d ) R + C 

2:1 

0. 194 

0. 119 

0.016 


3:2 

0.206 

0. 131 

0. 028 


4:3 

0.317 

0. 242 

0. 139 


5:4 

0. 179 

0. 104 

0.001 


6:5 

0. 407 

0. 333 

0.230 


7:6 

0. 374 

0. 299 

0. 196 

估计参数 






1 

2 3 

4 5 

6 7 

行效应 

0. 000 

— 0. 086 —0. 159 

-0. 122 -0. 222 

一 0. 095 0. 000 


— 

(0.114) (0.106) 

(0. 092) (0. 105) 

(0. 115) — 

列效应 

0. 000 

0. 279 0. 484 

0. 586 



— 

(0. 044) (0. 062) 

(0. 087) 


替代性正态化 





行效应 

0. 000 

-0. 086 -0. 159 

-0. 122 -0. 222 

— 0. 095 0. 000 



(0. 114) (0. 106) 

(0. 092) (0. 105) 

(0. 115) 一 

列效应 


0. 000 0. 084 

0. 094 0. 000 



— 

(0. 032) (0. 039) 

— 


单一性关联 

0. 195 





(0. 029) 




( e ) RC 

2:1 

0. 153 

0. 119 

0. 056 


3:2 

0. 204 

0. 159 

0. 075 


4:3 

0.314 

0. 245 

0. 116 


5:4 

0. 135 

0. 105 

0. 050 


6:5 

0. 442 

0. 345 

0. 163 


7:6 

0.378 

0. 295 

0. 140 

估计参数 






1 

2 3 

4 5 

6 7 

行效应 (A) 

— 0. 482 

—0. 376 —0. 234 

—0. 016 0. 078 

0. 384 0. 646 


(0. 068) 

(0. 050) (0. 048) 

(0. 037) (0. 049) 

(0.060) (0.061) 

列效应 (Vj) 

-0. 748 

— 0. 141 0. 332 

0. 557 



(0. 027) 

(0. 047) (0. 052) 

(0. 048) 


内在关联(今） 

2. 373 





(0. 238) 





注:括 号内的数值为渐进标准误。详情请见正文。 
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例如，在 R + C 模型中，当考虑第一行和第二行与第一列和第二列的单元格 
时，相邻对数优比便等于 194(-0. 086 + 0. 279)。 同样，对于第六行和第七行 
与第三列和第四列的单元格，相邻的对数优比便等于 0 • 196 。在选择性正态化 
中，相邻对数优比的计算是完全相同的，尽管计算有些复杂 (见 公式 2 . 15) 。另 
一方面 ，在 RC 模型下，相邻对数优比分别等于 0. 153 和 0. 140( 见公式 2. 19)。 最 

后，我们鼓励读者应用这些公式来计算其他项目中期望的相邻对数优比。 

我们对于政治取向和对性别分工的态度之间关系的理解在很大程度上是 
保持一致的，不管我们最后使用 U 、 C 、 R + C 或者 RC 模型。这是因为所有估计 
数值都是单调的，而它们之间唯一的差别在于这些数值是否等距。因此，“一个 
人在政治上越保守(或者自由），那么他/她就越同意 (或 者不 同意) 这一‘隔离领 
域， 意识形态”的陈述多半是有效的。 


例 2. 2:二维关联模型 


第二个样本(表 2. 2) 是关于美国女性的教育获得和职业获得关系的分析。 
这一表格是从1985年至1990年持续的综合社会调查中得到的，并且笔者 
(1995、 2001) 曾经使用过这一数据。教育获得是由教育资历(所获得的最高教 
育程度)而不是教育年限测量的，用以模拟教育文凭与劳动力市场结果之间的 
关系。它有4种情况 :大学 及以上、大学以下、高中和高中以下。职业获得则通 
过技能水平和工业部门分为5种类别 :高级 非体力、低级非体力、高级体力、低级 
体力和农业。这里的分析还包括了白人和黑人。这一表格总共拥有3858个个 
案。早期的结果 (Clogg & Shihadeh , 1994； Wong , 2001) 建议，二维关联模型 

便足以帮助我们理解其中的复杂关系。 

除了独立模型外，表 2. 5还报告了一系列一维关联模型（第二行至第六行) 
和二维关联模型(第七行至第十一行)来说明教育和职业之间的关联性。 

当与简单的独立模型相比，拟合优度统计值得到显著改善时，没有一个一 
维关联模型 ( U 、 R 、 C、R + C 和 RC ) 生成令人满意的结果。每一个模型的 P 值 
都在 0.001 的水平上显著。并且，从相异指数可以看到，相当比例的个案无法 
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归类。 

表 2.5 关于表 2.2( b ) ( EDUCXOCC ) 的关联性分析 


(a) 适用于表格 2. 2(b) 的关联模型 


模型描述 

df 

L 2 

BIC 

A 

P 

1. o 

12 

1373. 18 

1274. 08 

23. 86 

0. 000 

2. U 

11 

244. 02 

153. 18 

8. 54 

0. 000 

3. R 

9 

205. 97 

131. 65 

7. 38 

0. 000 

4. C 

8 

155. 37 

89.31 

7. 47 

0. 000 

5. R + C 

6 

91.61 

42.06 

4. 63 

0. 000 

6. RC 

6 

125. 06 

75. 51 

6. 44 

0. 000 

7. U + RC 

5 

17. 60 

_ 23. 69 

1. 52 

0. 004 

8. R + RC 

4 

6. 94 

_ 26. 10 

0. 83 

0. 139 

9. C + RC 

3 

11.41 

-13. 37 

1. 01 

0. 010 

10. R + C + RC 

2 

0. 28 

— 16. 24 

0. 01 

0. 870 

11. RC(2) 

2 

0. 60 

-15. 92 

0. 09 

0. 741 


(b ) 表 2. 2(b) 中的关联要素 


要 素 

使用的模型 

df 

似然比卡方值 

第一维度 

(1) 一 (6) 

12-6 = 6 

1248. 12 

第二维度 

(6)-(11) 

6 — 2 = 4 

124. 46 

高维度 

(11) 

2 

0. 60 

总效应 

(1) 

12 

1373. 18 

(c ) 表 2. 2(b) 中的关联行与列效应要素 

要 素 

使用的模型 

df 

似然比卡方值 

U 中的一般效应 

(1)-(2) 

12 — 11 = 1 

1129. 16 

RC 中的行与列效应 

(2)-(6) 

11 — 6 = 5 

118. 96 

R + C + RC 中的 
累加的行与列效应 

(6)-(10) 

6 — 2 = 4 

124. 78 

其他效应 

(10) 

2 

0. 28 

总效应 

(1) 

12 

1373. 18 


注: BIC 表示贝氏信息准则，在这里， BIC = L 2 — dfX InN ； △表 示相异指数。 


相比之下，从一维关联模型转向二维关联模型从而增加模型的复杂性，我 
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们发现，至少有两个模型可以为教育和职业之间的关联性提供适当的解释。例 
如，在 RC 模型中增加一个单一的单一性关联参数(第七行， U + RC) 导致第六 
行 RC 模型在拟合优度统计值上的显著改善 (1 个自由度， AL 2 为 107. 46)，并且 
BIC 统计值现在变成了负值，这优于其他相对简单的模型所报告的 BIC 统计值。 
虽然如此，如果我们使用传统的卡方检验作为模型选择的指南 (5 个自由度， L 2 
为 17. 40)，那么，这个稍复杂的模型仍然令人不满意。而添加行效应参数和列效 
应参数(分别为第八行和第九行)同样无法提供令人满意的结果，尽管后面这个模 
型的总体拟合程度是边缘有效的。另一方面，在 RC 模型中同时添加行与列效应 
(对数线性或者对数乘积)(如第十行和第十一行)生成令人满意的结果。两个模型 
的 P 值是相当可接受的，并且样本中只有很小比例的个案无法归类。 [12] 

通过 O、RC 和 RC ⑵模型之间的比较，表 2. 5(b) 呈现了可通过一维、二维和 
高维关联模型估计得来的 L 2 的比例情况。这一分解清楚地表明，当第一维度解释 
了接近90%的 L 2 ，而第二维度则贡献了另外的9%时，其他高维度的贡献可以忽 
略不计。表 2. 5(c) 提供了关于 R + C + RC 模型的另一种分解方法。它基本上导 
致相同的结论，即行与列效应额外的维度，不管是对数线性还是对数乘积，都有助 
于我们理解关于女性教育资历和职业获得之间复杂的关系。 

与表 2. 4类似，表 2. 6不仅报告了从不同的二维关联模型中计算而来的参 
数估计值及它们的渐进标准误，还计算出了期望的相邻对数优比，所以我们可 
以了解每一个模型中优比的强加结构是什么样的。例如，给定从 U + RC 模型 
中得到的参数估计值，我们可以计算得出第一行和第二行与第一列和第二列的 
期望的相邻对数优比等于 1. 132,即 0. 552 + 3. 435 X (0. 147 - 0. 722) X 
(― 0. 451-0. 158)。同样，第三行和第四行与第四列和第五列的期望的相邻对 
数优比等于 1. 790，即 0. 552 + 3. 435 X [ — 0. 236 — ( — 0. 633)] X [0. 855 — 
(一 0. 053)]。关于参数的确切解释会更加复杂，因为模型是二维的。假如第一 
维度可以通过单一的单一性关联参数捕捉到，那么，它就认定教育资历和职业获 
得之间的关系在很大程度上是一致的、线性的和等距的。另一方面，第二维度计算 
这种线性关系之外的情况。例如，将行与列数值参数的信息结合在一起，第二维度 
表明，具有高中或者高中以下学历的女性很有可能会在低级非体力的工作职业上 
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结束职业生涯。假如 U+RC 模型不是首选模型，这意味着，尽管教育资历和职业 
获得的垂直式社会经济观点基本上是有效的(如教育资历越高，职业的等级就越 
高），但等距离的假设在事实生活中显得有些绝对而无法成立。 

出于同样的原因，我们可以轻易地从估计的参数中为其他二维关联模型计 
算出期望的相邻对数优比。为了简化起见，余下的讨论仅仅集中在 RC (2) 模型 
上。[ 13] 通过公式 2. 29 或者公式 2. 34, 我们可以直接计算出期望的相邻对数优 
比。例如，关于第一行和第二行与第一列和第二列的优比将等于 1. 481，即 2. 601 X 
_ ~ 0. 089 — ( — 0. 744)] X [ — 0. 020 — ( — 0. 765)] + 1. 522 X ( — 0. 061 — 0. 276) X 

[-0. 549 -(-0.137)] ，而关于第三行和第四行与第四列和第五列的优比将会是 
0. 966, BP 2.601 X (0.632 — 0. 200) X (— 0. 088 - 0. 550) + 1. 522 X [0. 562 - 
(一 0. 077)] X [0. 816 — (一 0. 010)]。基于行与列类别的等级排序，十分清晰的是 
第一维度或多或少是具有社会经济特性的，即受到更好教育的女性更可能占据 
高级非体力的工作职业。然而，由于农业类别的估计的列数值是负数 
(一 0. 088)，这就意味着，当其他都保持一致时，美国女性(包括黑人和白人)很可 
能从事农业职业，而不是高级或低级体力职业。非体力职业与务农职业之间的 
隔离程度相对于体力部门而言事实上是更弱的。同样，假如在第一维度中，行 
与列类别之间的估计距离并不是等距的，那么，我们现在就可以理解相对于更 
加复杂的模型，如 R + C+RC 或者 RC ⑵模型，为什么 U+RC 模型无法提供令 
人满意的解释。 

表 2. 6表 2. 2( b ) ( EDUCXOCC ) 中的期望优比和估计的关联参数之间的关系 


关联模型 - ㈣ ，邻職优比 




2:1 

3 * 2 

4:3 

5:4 

( a ) U+RC 

2:1 

1. 132 

0. 043 

0. 274 

—1. 244 


3:2 

1. 337 

-0. 137 

0. 175 

-1.881 


4:3 

0. 153 

0. 903 

0. 744 

1.790 

估计 

1 

2 

3 

4 

5 

行数值 (fXi) 

0.722 

0. 147 

_ 0. 633 

_ 0. 236 



(0. 049) 

(0. 095) 

(0. 046) 

(0. 066) 




关联模型 


219 



关联模型 


列数值 (Vj) 


内在关联 (N) 


列效应 (Vj 


内在关联 (N) 


期望的相邻对数优比 
3:2 4:3 


_ 0. 158 
(0. 033) 
单一性关联 


—0. 451 
(0. 039) 


-0. 194 
(0. 058) 


— 0. 053 
(0. 041) 
内在关联 (N) 


3. 670 
(0. 547) 


-0. 117 
(0. 055) 
2. 509 
(0. 473) 


— 0. 559 
(0. 077) 


-0. 127 
(0. 093) 


-0. 009 
(0. 064) 


0. 855 
(0.013) 



0. 552 



3. 436 



(0. 034) 



(0. 619) 


(b) R + RC 

2:1 

1. 488 

0. 175 

0. 498 

— 1. 465 


3 : 2 

1.019 

— 0. 249 

0. 063 

— 1. 832 


4:3 

0. 156 

0.916 

0. 729 

1.864 

估计参数 

1 

2 

3 

4 

5 

行效应 

0. 000 

— 0. 432 

-1.267 

0. 000 



— 

(0. 221) 

(0. 193) 

— 


行数值 (A) 

-0. 760 

— 0. 061 

0. 613 

0. 209 



(0. 042) 

(0. 097) 

(0. 049) 

(0. 068) 


列数值 (Vj) 

— 0. 806 

— 0. 057 

0. 180 

0. 543 

0. 140 


(0.017) 

(0. 045) 

(0. 063) 

(0. 046) 

(0. 112) 


(c) C+RC 

2:1 

1. 171 

0. 109 

0. 158 

-1. 247 


3:2 

1. 296 

_ 0. 013 

0. 125 

-1. 477 


4:3 

-0. 009 

1.262 

0.471 

0. 941 

估计参数 

1 

2 

3 

4 

5 

列效应 

0. 000 

1. 263 

1. 282 

1.416 

0. 000 


— 

(0. 170) 

(0. 209) 

(0. 091) 

— 

行效应 (A) 

_ 0. 333 

(0. 133) 

一 0. 251 

(0. 089) 

— 0. 281 

(0. 144) 

0. 865 

(0. 007) 



0. 811 
(0. 041) 


(d) R + C + RC 

2 : 1 

1. 503 

0. 260 

0.414 

— 1. 280 


3:2 

0. 989 

一 0. 126 

一 0. 021 

— 1. 603 


4:3 

_ 0. 003 

1.270 

0. 470 

0. 982 

估计参数 

1 

2 

3 

4 

5 

行效应 

0. 000 

一 0. 290 

— 0. 955 

0. 000 



—— 

(0. 184) 

(0.217) 

— 
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(续表) 


关联模型 


期望的相邻对数优比 




2:1 

3:2 

4:3 

5:4 

列效应 

0. 000 

0. 000 

0. 397 

0. 327 

0. 000 


— 

— 

(0. 167) 

(0. 161) 

— 

行数值 (A) 

-0. 766 

(0. 037) 

_ 0. 055 

(0. 090) 

0. 601 

(0. 047) 

0. 221 

(0. 068) 


列数值 (Vj) 

- 0. 838 

0. 044 

0. 119 

0. 501 

0. 174 

内在关联 (<(>) 

(0. 025) 

2. 857 

(0. 534) 

(0. 089) 

(0. 092) 

(0. 066) 

(0. 126) 

(e) RC(2) 

2:1 

1. 481 

0. 362 

0. 331 

一 1. 510 


3:2 

1. 008 

一 0. 211 

0. 051 

-1.378 


4:3 

一 0. 002 

1. 259 

0. 480 

0. 966 

估计参数 

1 

2 

3 

4 

5 

第一维度 

行数值 (p) 

-0. 744 

(0. 041) 

-0. 089 

(0. 042) 

0. 200 

(0. 101) 

0. 632 

(0. 074) 


列数值 ( Vjl ) 

— 0. 765 

一 0. 020 

0. 323 

0. 550 

-0. 088 

内在关联(^) 

(0. 052) 

2. 601 

(0. 151) 

(0. 077) 

(0. 101) 

(0. 060) 

(0. 179) 

第二维度 

行数值(~) 

0. 276 

(0. 121) 

-0. 061 

(0. 158) 

-0. 777 

(0. 063) 

0. 562 

(0. 086) 


列数值 (v j2 ) 

-0. 137 

-0. 549 

— 0. 120 

—0. 010 

0.816 

内在关联(扣） 

(0. 160) 

1. 522 

(0. 075) 

(0. 092) 

(0. 120) 

(0. 036) 


(0. 325) 


注:括 号内的数值为渐进标准误。详情请见正文。 


为了全面理解 RC (2) 模型报告参数的意义，从两种维度估计而来的行与列 
数值通过对称正态化方法(公式 2. 38) 分别标示在图 2. 2和图 2. 3上。在两种 
情况下，我们可以看到除了农业类别外，第一维度行数值和列数值都具有清晰 
的等级排序。另一方面，第二维度行与列数值的等级排序并不明显。正如之前 
所指出的那样，我们可以将第二维度的行与列数值看做偏离第一维度的部分， 
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即第一维度中描述的，或者超出或无法校正的垂直式图景的部分。在很大程度 
上，它们代表着美国女性在劳动力市场上面对的第一维度所描述的“能力至上” 
法则之外的特定机制和障碍。以上模式支持了女权主义者关于美国社会中性 
别分工的观点。 


1.2 

0.8 

0.4 

0 

-0.4 

— 0 . 8 
_ 1 . 2 





高中以下 

•大学及以上 


大学 J 下 





* 高中 

1 1 1 

1.2 -0.8 —0.4 C 

第一 

图 2. 2 表 2. 5 中从模型 11 

0.4 0.8 1.2 

-维度 

估计而来的教育数值 

. 

农业 ® 





■ 

9 高级非体力 

一 * n 低级体力 
高级体力 

低级非体力 ® 




1 1 i 

__1_1_ 

1.2 ― 0.8 — 0.4 0 0.4 0.8 1.2 


第一维度 


图 2. 3 表 2. 5 中从模型 11 估计而来的职业数值 


















第 3 章 I 分析三向表的偏关联模型 


上一章中描述的关联模型的类型可以轻易地扩展至三向或者多向交互表 
的分析中 （Agresti， 1983； Agresti & Kezouh, 1983； Becker, 1989a； Becker & 
Clogg，1989； Pannekoek，1985) 0 唯一的复杂因素是要决定哪一组参数(二路、 
三向和/或者更高阶交互参数)应该被分解到关联参数中。在本章中，当没有必 
要加人三向或者更高阶参数时，我们将引入分解二路交互参数的简单模型。在 
第4章中，分解将同时包括二路和三向（或者更高阶)的交互参数。后者可以在 
多数社会科学应用中找到。在多数情况下，第三个变量层变量是一个分组变 
量，例如，同龄群体、调查年份、种族/民族、国家/地区。“分组变量，，这一词语是 
在最一般的形式上定义的，并且可能涉及两个或更多的变量。例如，它可以是 
不同调查年份下种族不同的性别变量，或者不同调查年份下同龄群体不同的国 
家变量。最后，尽管目前的讨论主要集中在3个变量上，这里引入的模型可以推 
广至分析更高阶的交互表格。 

完整的独立模型 

假设我们有3个变量， A 、 B 和 C 作为行、列和层变量，并且每个变量分别拥 
有I、 J 和 K 个类别。在以等级式对数线性模型研究这些变量间的关系时，传统 
的策略通常是以完全独立模型作为起点，然后增加各种二元的交 互项， 当加入 
低阶项的模型都无法提供令人满意的结果时，就要加人三元交互参数。再一次 

说明，我们接下来的讨论和分析并不需要将它们的关系清晰地界定为因变量和 
自变量。 



关联模型 


223 


完整的独立 ( I ) 模型假定变量 A 、 B 和 C 之间并不存在任何关系。在 I 模型 
下，期望频率的对数可以表述 如下： 

log F ijk = X + xf + Xj B + Xk [3. 1] 

这里的 X 表示截距， Xf 、< 和 4 是边界参数，所有这些值都服从传统的正态分 
布，类似于第2章中介绍的参数 ( Agresti ， 2002)。这个模型拥有 UK — I — J — 

K +2 个自由度。 

有两种类型的优比可在三向表格中被检验和被模型化 （Agresti ， 1983; 
Becker , 1989 a ； Becker & Clogg ，1989； Clogg ，1982 a ； Wong , 2001) 0 第一种 

优比是给定 C 的情况下， A 和 B 的条件局部优比 0 UOO ，而第二种优比0#则是条 
件局部优比的比率或者 A 、 B 和 C 的局部优比。后者便是层 k +1 对层 k (更一 
般来说即层 k 对层 k ') 的条件局部优比的比率。正式地说，在给定 C 的情况下， 
A 和 B 的条件局部优比可以定义如下： 


j — FtikFn-1 , i+l，k 

)lj(k) = F … k F“ m ， k 


[3.2] 


并且 A 、 B 和 C 的局部优比可以定义为条件局部优比的比率，即 


— 0ij(krfl) 

^ ^ 0i j(k ) 


[3. 3] 


般来说，我们宁愿采用对数转换的形式。它更容易证实在 I 模型下，它们 


全都等于 1( 或者对数形式下等于 0) ，即 


log ftj ( k ) = 0 
log 0 i ( j>k = 0 
log 0 (i )jk = 0 


以及 

log 0ijk = log 0ijOH-l) — log 0ij(k) = log 0i(j+l)k — log 0i(j)k = log 0(H-l)jk — log 0(i)jk 
= 0 [3.4] 
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列表数据分析 


条件独立模型 

在多数社会科学应用中，完整的独立模型不太可能很好地拟合数据。通常 
下一步是要加人二元交互项(在 A 和 B 、 A 和 C 和/或者 B 和 C 之间）以捕捉偏 
离完全独立性的部分。例如，只有 AB 和 AC 二元交互项的模型可以表达如下： 

logF ijk = X + X, A + Xf + ^ + xf + 4 C [3. 5] 

公式 3. 5被称为“条件独立 ( CI ) 模型”，因为它假设控制变量 A 、 变量 B 和变量 C 
之间不存在关系。换言之，变量 B 和变量 C 是在控制变量 A 之后便成了虚假关 

系。这个模型拥有 I ( J 一 1)( K 一 1) 个自由度。在以上公式中，显而易见的是条 
件和局部优比具有以下 关系： 


log 0( i) jk = 0 


和 


log 0 ijk = 0 [3. 6] 

要留意的是 ， log 0 i(j)k ffl log 0 iK k) 并不能在条件独立的情况下被简化。 


关联性条件独立模型 


如果条件独立模型可以很好地拟合数据，那么可以将两个交互参数分解为 
偏关联参数，从而获得更简明的解释 ( Wong ， 2001)。例如， AB 偏关联参数可以 
通过 RC ( M 1 ) 关联要素表示，然而 AC 偏关联参数则可通过 RL ( M 2 )关联要素 
表示。最终的有条件独立的关联模型 ( CIA ) 可以表示 如下： 

log F ijk = x + + xf + x l k ： + I ] 二 + E 1 •/ wt , [3. 7] 

这里的 M ! 和 M 2 表示获得 AB 和 AC 偏关联参数所需要的维度，其中 0 < 
Mi ^ min(I — 1, J — 1) 且 0< M 2 < min ( I — 1, K — 1)。 这个模型拥有 IJK — 
1 一 J — K + 2 —MJI + J — IV^ — 2) — M 2 (I + K — M 2 — 2) 个自由度。为了唯 
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一地确定所有参数，需要加上集中、尺度和跨兀交互等约束。当 Mi = M 2 = 1 
时，公式 3. 7可以简化 如下： 

log Fijk =入 + 入 f + 入 f + 入 [ + 令八 ViVj + wk [3. 8] 

这个模型拥有 UK —31—2 J — 2 K +8 个自由度。另外，也可以加入一致的行数 
值约束，即对于所有的 i ， 有 p = 〆 ，从而获得一个更简化的模型。受限模型将再 
获得 I 一 2个自由度，从而拥有 UK —21 —2 J —2 K +6 个自由度。因为 CIA 模型仍 
然假设条件独立的存在，所以，公式 3. 6下的优比的结构应该依然成立。 

完全二元交互模型 

当条件独立模型不可接受时，必须加人所有的二元交互项，但不要加人三 
元交互参数。那么， FI 模型可表述如下： 

log F ijk = X + Xf + Xf + Xk + + [3. 9] 

它拥有 （ I 一 1 )(J 一 1)( K 一 1) 个自由度。如果变量 A 是一个分组变量，如同龄 
群体、调查年份或者国家，公式 3. 9有时被称为“固定”或“同质关联模型”，因为 
它假设关联模式在 A 的不同水平上都是相同的。例如，如果变量 A 代表种族 
(亚裔、黑人、西班牙裔、白人和其他），而变量 B 和变量 C 分别代表个人的教育 
和职业情况，那么， FI 模型假设教育和职业的关联性在所有5个种族组别上是 
相同的。在公式 3. 9下，只有 log 0 ljk = O , 而所有其他条件的相邻对数优比无法 
得到进一步简化。 

偏关联模型 

采用克洛格等人的处理方法，我们可以将所有二元交互项分解为偏关联要 
素。用最简单的例子说明， RC (1)+ RL (1)+ CL (1) 偏关联模型具有以下 形式: 

log Fijk =入 + 入广 + 入 f + Xk + Ol Vji + Oil T)kl + Vjl T)ki [3. 10] 
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这里限制 = 2 j=i ^ ^ 2 j = i^i = 2 k=i Tjid = SLiVi = 

n a V 1 1 2 _ V' 1 *2 — J 2 — ^ J *2 — K 2 — K *1 
U， 丑 ^i=ifXii — /-J i=l^il — Z - A \=\ V )\ ~ Zj j=l V jl ~ Zj^l ^ ~ Zj k=l Tkl = 丄， 

即在行、列和层数值上，同时需要集中和尺度约束来识别这一模型。而叫和^分 
别是 AB 和 AC 偏关联上的估计行数值，冲和 < 分别是 AB 和 BC 偏关联上的估 
计列数值， W 和$分别是 AC 和 BC 偏关联上的估计层数值，并且{严、和 
今广’分别是 AB、AC 和 BC 偏关联上的内在关联参数。这个模型拥有 IJK — 31 — 
3 J —3 K +11 个自由度。以上模型称为“非受限 RC (1)+ RL (1)+ CL (1) 偏关联 
模型” ( Wong ， 2001)，因为它在分解每个二元交互项时只有一个维度，并且在不 
同的偏关联上并不存在对行、列和层数值的(单一性的)约束。 

一个更受限的模型是在行、列及层数值上加入一致的数值约束 ，即叫 = 
WK 和，= W 。通过这些约束，公式 3. 10可以 写成： 

log Fij k =入 + 入广 + 4 + <J>f B jUii Vji + (f>f c /JtilTjkl + Vji T)kl [3. 11] 

当对行、列和层数值加上一致的数值约束时，公式 3. 11 被称为“受限 
RC (1)+ RL (1)+ CL (1) 模型” （ Clogg ，1982 a 、1982 b )。 这个模型拥有 IJK — 
21 — 2 J — 2 K + 5 个自由度。公式 3. 10和公式 3. 11之间似然检验值的差异产生 
了一个自由度为 I+J + K — 6的 n 2 统计值，这个统计值可以被用来检验一致的 
数值约束是否真的与数据相一致。当然，对3个变量中的一些但不是全部加上 
一致的数值约束同样是可以接受的，例如， j^il — /jtil ^0 Vjl = Vj ； [，但 T) kl 关‘。 

当非受限和受限 RC (1)+ RL (1)+ CL (1) 模型都不能拟合数据时，我们可 
以在每个二元偏交互项上增加维度来强调其中关系的复杂性。最常见的形式 
可以称为“ RCXMD + RUMO + CUMs ) 模型” (Wong, 2001) ， 这里的 M】 、 M 2 
和 M 3 分别代表 AB 、 AC 和 BC 偏关联维度 ； 0 < Mi < min(I — 1 ， J — 1) 、 0 < 
M 2 <min(I-l, K 一 1) 且 0<M 3 <min(J-l，K—1) 。 在不损失一般性的情 
况下，每组内在关联参数可以从大到小地排列。事实上，这个模型是之前章节 
讨论过的 RC(M) 关联模型的一般化形式 （ Becker ， 1989a、 1992； Goodman, 
1986、1991)。 因此， 尺(：(]^ 1 *)+1^(]^ 2 *)+(：以]\4 3 *)模型是一个饱和模型，因 
为加入了每一个二元交互项，所以这里有 Mr = min(I — 1, J 一 1)、 M 2 * = 
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min(I — 1， J — 1) 和= min(J - 1, K 一 1) ，并且它等同于公式 3. 9 的 FI 模 
型。一般而言， RaMJ + RUMD + CLCMD 模型可以表述 如下： 


log Fijk == X + Xf + Xf + Xk + 2 : 

丄 ▽ ^ , AC * 丄 ▽ H BC * * 

2 ^i m=1 ym Mim^km I <J> m 


[3. 12] 


为了唯一地确定这些参数，需要在每个二元交互项之内的行、列和层数值 
参数之上设置集中、尺度及跨元交互等约束。集中约束 如下： 


S: =1 f = si 


A 


m 


J — J * 
Zj : =l ^rn = Zj : =1 V im 




K * 
2-J k =1 



尺度和跨元交互约束可以简洁地表示 如下: 


= 2 ;= 




2 L 


VjmVj 


m 


E J X 

j=i 




^ =1 ^kmTjW = 〉 ： k—} 々 km 1km’ = & 


这里的 SrW 是 KroneckerA 系数，如果 m = m , , 那么 SnW = 1 ，否则 S^w = 0 ( 提 
示， m 和 n / 依据可应用于特定偏关联上的维数 M 2 * M 3 而变化）。这个模 
型拥有 UK — I — J — K + 2 — Mi ( IH ~ J — Mi — 2) — M 2 (I H ~ K — M 2 — 2) — M 3 
(J + K — M 3 — 2) 个自由度。我们同样可以将对数线性和对数乘积要素都添加 
到公式 3. 12中，以建立前面章节讨论过的混合偏关联模型。这种方法对一些研 
究者而言是有吸引力的，因为它并不需要在特定的混合模型中加人跨元交互 
约束。 

基于公式 3. 12,在 RaMO + RI / MJ + CUMs ) 模型中，给定 C 的情况下 
A 和 B 的条件局部优比、给定 B 的情况下 A 和 C 的条件局部优比，以及 A、B 
和 C 的局部优比如下 所示： 


log 9ij(k) — 2 : =1 m 

log 9i(j)k — X) m=1 ^ (/^l，m 


—Pim)(Vj+l， m — Vjm) 

— 心 ）（ TJkrfl , m — T)km ) 
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log 0(i)jk = 



和 


log 0 ijk = o [3. 13] 

因此，模型 RCCMO + RL ( M 2 )+ CL ( M 3 ) 没有假设 A、B 和 C 之间的任何 
三元交互项，并且条件对数优比可以简单地写成行、列和/或者层数值的乘积总 
和的函数以及它们各自在不同维度上的内在关联参数。如果= M 2 = 
M 3 =M ，那么非受限模型 RC ( M ) + RL ( M ) + CL ( M ) 的自由度可以简化为 
IJK - I - J-K + 2- M (2 I + 2 J + 2 K —3 M — 6) 0 

尽管相似的单一性数值约束可以轻易地应用到 RC ( M )+ RL ( M )+ CL ( M ) 
模型中，但是对于一个特定模型的确切自由度的计算却变得更加复杂，因为并 
不需要所有跨元交互约束来唯一地确定所有参数。正如笔者曾 （2001) 提出的， 
只要一组跨元交互约束，不管是在行、列或者层数值上，便足以唯一地确定行、 
列和层数值受到单一 ; 性数值约束的受限 RC ( M ) + RL ( M ) + CL ( M ) 模型。例 
如，对于具有单一性数值的受限 RC (2)+ RL (2)+ CL (2) 模型，只有一个(而不 
是3个)跨元交互约束需要加在{ 抑， 抑}、 { Vjl 、 吨}或者{>，啊}上。 

同样，对于受限的 RC (3)+ RL (3)+ CL (3) 模型，只有 3 个跨元交互约束 
(而不是 9 个）需要加在{柙， ㈣ ，冲}、{冲， Vj 2 ， Vj 3) 或者 { r ) kl ， T ) k 2 ， TJka } 上。即 

只需要添加叫抑二 D i=l 叫冲 = i=i/jti2]Ui3 — 0, D i j =1 V ) \V}2 = 

= 2 j=l ^ j 2 V j3 =0 或者 k=i TJkl T ) k 2 — s k=l "^kl TJU3 = 〉 : k=i TjU2 Tjk3 = 

0 中的一个。 一 般而言，在行、列和层数值的所有维度上具有单一性数值约束的 
受限 RC ( M ) + RL ( M ) + CL ( M ) 模型拥有 IJK - I - J - K + 2 - M(I + J + 

K 一 3) + M(M — 1)/2 个自由度。对于一些在部分维度而不是所有维度上具有 

单一性数值约束的受限 RC ( M )+ RL ( M )+ CL ( M ) 模型，甚至可能不需要任何 

跨元交互约束。例如，再以 RC (2)+ RL (2)+ CL (2) 模型为例，如果在行、列和 

层数值上的单一性数值约束只应用在第一维度上，那么便没有强加任何正交约 
束的必要。 



识别的约束条件和自由度 

以上讨论提出了一个有趣但未曾处理过的问题，即如何计算一个特定模型 
的自由度。一般来说，跨元交互约束的数量可以通过计算雅可比矩阵的等级而 
确定 ( Goodman ， 1974； Sicilian 。 & Mooijaart , 1997) 0 在多数实践情况下，相 

对容易的做法是遵循由笔者 （2001) 建议的实证步骤来决定是否可以放松一些 
(如果不是所有)跨元交互约束。正如第2章讲述的，一个模型的自由度等于单 
元格的总数减去唯一参数的数量，尽管后者根据附加的识别的约束条件数量而 
定。例如，当集中和尺度约束作用于第 M 维度关联模型中的行数值时，只有 
(I 一 2) M 个行数值参数可以被唯一地确定。另一方面，如果模型的设定需要附 
加的跨元交互约束，那么，唯一参数的数量便是（ I 一 2) M — M(M —1)/2。如果需 
要，同样的规则也适用于列和层数值参数。 

在确定是否需要某些可识别的约束条件时，重要的是认识到这些约束的目 
的在于解决数据量不足以决定解的问题，以确保收敛的估计值是唯一的。这种 
情况与协方差结构分析中的识别不足的模型类似，即当未知的参数数量大于可 
获得的方差和协方差的数量时，满足同一组方程的解有无限多组。可识别约束 
条件的存在与否应该不会影响拟合优度统计值。由笔者 (2001) 概括的经验步骤 
细节如下，通过这一性质可以证实是否需要部分的跨元交互约束或者根本不需 
要，并且可以解释正确的自由度。对于受限多维条件关联模型而言，这一建议 
的方法是需要的，因为其中的许多模型需要比预期更少的约束或者根本不 
需要。 

接下来的步骤决定跨元交互约束是否必须，但是对其他约束的处理过程 
是:（1)首先，在迭代阶段中不需要跨元交互约束来估计模型，同时会记录下对 
数似然的拟合优度统计值 （ U ) 和参数估计值（艮）。 （2) 重新以不同的（随机的） 
初始值估计这个模型，并且记录下对数似然的拟合优度统计值 （U ) 和参数估计 
值（^ )。如果拟合优度统计值和参数估计值保持一致，那么就不需要跨元交互 
约束，并且这些估计值是唯一的。然而，如果只有拟合统计值保持不变，而参数 
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估计值发生变化，那么，这就意味着需要添加部分跨元交互约束。 （3) 收集一系 
列潜在跨元交互约束，并且在迭代阶段中只增加一个约束条件，然后比较收敛 
的拟合优度统计值 l 3 2 和 14 。如果= 那么，我们就需要这一特定的跨元 
交互约束。否则，就要继续使用另一个约束条件，直到所有潜在的约束都被检 
验过。 （4) 基于步骤 (3) 的结果，同时加入两个“要求的”约束条件，然后比较 
检验统计值 U 和 U 。 如果这些结果是相同的，那么，两个约束条件都是需要 
的。不断加入另外的约束条件，直到这些约束条件都被用完。这一递增的过 
程是必须的，因为跨元交互约束有时可以单独地加在行、列或者层数值参数 
上，而不是同时放入。 （5) 最后，根据从步骤 （4) 获得的有效的跨元交互约束 
的数量调整自由度。 


例 3.1: 有条件独立的关联模型 

表 3. 1展示了一张关于个人的政治取向 （ POLVIEWS ) 对性别分工的态度 
( FEFAM ) 与对国家福利支出的态度 （ NATFARE ) 之间的三向交互表。这里 
的 POLVIEWS 、 FEFAM 和 NATFARE 分别代表行、列和层变量。这张表是 
从2006年综合社会调查数据中整理而来的，并且拥有926个个案。 POL ¬ 
VIEWS 是一个自我识别的政治取向测量，具有7个类别 :强自 由主义、自由主 
义、弱自由主义、中间取向、弱保守主义、保守主义及强保守主义。而 FEFAM 
测量的是调查对象对如下陈述的同意 程度： “男人最好外岀工作，女人最好打 
理家务和照顾家庭。”调查对象的回答可分为非常不同意、不同意、同意和非 
常同意。最后， NATFARE 在关于国家福利支出方面具有以下 3 种反 应：过 
少、恰好和过多。这是之前一个例子的扩展。在第2章中，我们已经发现一个 
人在政治上越保守(或者自由），他/她就越同意（或不 同意） 这一 （男女） “隔离 

领域”的意识形态。这里主要是进一步了解它们与对国家福利支出的态度之 
间的相互关系。 

正如预期的一样，完全独立模型（表 3. 2的第一行)未能很好地拟合数据。 
这个模型拥有74个自由度， L 2 等于186,并且错误分类略大于16%。另一方 
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面 ，具有一些或者所有二元交互参数模型的相对拟合优度明显优于这一完全独 
立模型。具有 FI 的模型(第二行）在自由度为36的情况下，其 L 2 等于 35. 35, 


并且 p < 0. 50,所以这个模型是更好的。 

表 3. 1政治取向、性别分工态度和福利支出态度的交互情况 


国家福利支出 （ NATFARE ) 


过少 



恰好 

过多 

政治取向 

男人最好外出工作，女人最好打理家务和照顾家庭 ( FEFAM ) 

( POLVIEWS ) 

SD D 

A 

SA 

SD 

D 

A SA SD 

D 

A SA 

强自由主义 

9 5 

5 

1 

1 

6 

5 12 

2 

2 1 

自由主义 

17 13 

7 

4 

13 

22 

9 1 7 

13 

6 2 

弱自由主义 

8 14 

6 

0 

10 

29 

10 0 5 

14 

6 2 

中间取向 

20 38 

24 

8 

23 

72 

34 10 17 

67 

36 12 

弱保守主义 

4 21 

12 

4 

7 

30 

9 1 9 

19 

14 2 

保守主义 

2 9 

8 

3 

1 

16 

19 2 11 

28 

28 11 

强保守主义 

0 1 

5 

0 

2 

3 

3 2 2 

7 

6 6 

注 : SD 非常不同意 ; D 不同意; A — 

一同意; SA — 

一非常同意。 



资料来源: 2006年综合社会调査。 









表 3. 2 

<适用于表 3. 1的偏关联分析 



模型 




df 


L 2 BIC 

A 

P 

1. 完全独立 




72 


167.59 -324. 24 

14. 13 

0. 000 

2. 完全二元交互 




36 


35. 35 —210. 56 

5. 72 

0. 499 

3. 条件独立于 POLVIEWS 



42 


47. 25 一 239. 65 

7. 30 

0. 267 

4. 条件独立于 FEFAM 



48 


87.33 —240. 56 

10. 33 

0. 001 

5. 条件独立于 NATFARE 



54 


91.04 —277.83 

10. 08 

0. 001 

6. RC (1)+ RL (1) 偏关联 



57 


68.58 —320.78 

8. 83 

0. 140 

7. 模型6加上单一性行 （ POLVIEWS ) 

62 


72.77 —350. 74 

9. 07 

0. 165 

数值约束 









8. 模型6在行 ( POLVIEWS ) 数值上添加单 

64 


73.59 —363. 58 

9.21 

0. 193 

一性和平等性约束 (/II = IJ 2 9 

^4 = 








注: POLVIEWS 、 FEFAM 和 NATFARE 分别作为行、列和层变量。 


其他3个模型(第三行至第五行)是不同的条件独立设定形式。这些结果暗 
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示着，在个人政治取向 ( POLVIEWS ) 的条件下， FEFAM 和 NATFARE (第三 
行)是相互独立的。这个模型拥有 4 2 个自由度， L 2 等于 47, 并且当控制 POL - 
VIEWS 时， FEFAM 和 NATFARE 的观察关系是虚假的。它们都由个人的政 
治取向所决定。 

模型2和模型 3 之间的差异生成了 6个自由度，等于 11. 90的 L 2 , 而卡方统 
计值刚好达到显著水平 （P = 0. 06) ， 这表明，加入 FEFAM 和 NATFARE 的交 
互项的贡献相对少。第六行进一步分解了条件参数(细节见公式 3. 8)。尽管当 
前模型的相对拟合优度有所下降，但是其拟合程度的下降是不显著的 （15 个自 
由度， AL 2 = 21. 33, P = 0. 12), 所以这一模型更好。最后，第七行的模型在 
POLVIEWS 变量上加上单一性行数值约束(如，⑷= 〆 ），然而第八行的模型 
加人了额外的不平等性约束，如 p 和⑷ =卜 5 ，即在强自由主义和自由主 
义之间的距离等于保守主义和弱保守主义之间的 距离。 这种不平等性约束有 
助于保持在 RC ⑴和 RL(1) 偏关联中发现的单调关系。在两种情况下，拟合程 

度的下降是微小的，但最后一个模型(第八行)提供了理解这3个变量之间关系 
的最简单方法。 

表 3. 3报告了表 3. 2中最后3个模型的参数估计值和它们的渐进标准误。 
由于从这些模型中得到的点估计值只有细微的不同，所以接下来的讨论主要集 
中在模型8上(如具有单一性行数值约束和不平等性约束）。 cia 模型告诉我 
们，不仅 FEFAM 和 NATFARE 之间的关系在条件 POLVIEWS 下是独立的， 
而且我们同样可以在高度参数化的形式下描述这种关系。 一 般而言，一个人的 
政治取向越自由，他/她就越不同意“性别化”的劳动分工，并且会认为美国政府 
在国家福利项目上并没有足够的支岀。然而，性别分工和福利支出之间的关系 
是虚假的。这两者之间的任何观察关系在很大程度上是个人政治取向的结果。 
而且，这些偏关系是倾向于单调性的，除了强自由主义与自由主义之间和保守 
主义与弱保守主义之间并不存在明显的差别外。事后看来，我们可以在表 2. 4 
中的 RC 模型上更早地加入约束条件 = 叫 和/或者 a = ⑷，以获得对 pol - 
VIEWS 和 FEFAM 之间关系的简单理解。 
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表 3. 3经由选择的偏关联参数 （ POLVIEWSXFEFAMXNATFARE ) 



模型 6 

模型 7 

模型 8 

POLVIEWS X FEFAM 偏关联 

<(>RC 

1. 983 

1. 950 

1. 942 


(0. 744) 

(0. 374) 

(0. 374) 

JJ -1 强自由主义 

— 0. 189 

-0.413 

— 0 . 403 


(0. 175) 

(0. 111) 

(0. 043) 

自由主义 

— 0. 456 

_ 0. 386 

— 0. 403 


(0. 112) 

(0. 083) 

(0. 043) 

弱自由主义 

一 0. 365 

一 0. 269 

— 0. 279 


(0. 115) 

(0. 084) 

(0. 082) 

中间取向 

一 0. 013 

0. 027 

— 0. 002 


(0. 082) 

(0. 057) 

(0. 047) 

强保守主义 

— 0. 063 

— 0. 056 

— 0 . 002 


(0. 111) 

(0. 077) 

(0. 047) 

保守主义 

0.421 

0. 494 

0. 492 


(0. 124) 

(0. 084) 

(0. 084) 

弱保守主义 

0. 665 

0. 601 

0. 597 


(0. 110) 

(0. 086) 

(0. 087) 

V ] 非常不同意 

— 0. 703 

-0. 726 

-0. 733 


(0. 064) 

(0. 059) 

(0. 058) 

不同意 

— 0. 208 

—0. 170 

一 0 . 162 


(0. 094) 

(0. 093) 

(0. 093) 

同意 

0. 300 

0. 304 

0. 313 


(0. 110) 

(0. 111) 

(0. 111) 

非常同意 

0. 610 

0. 593 

0. 582 


(0. 092) 

(0. 095) 

(0. 097) 

POL VIEW X NATFARE 偏关联 

</>RL 

1. 567 

1. 438 

1.412 


(0. 405) 

(0. 226) 

(0. 226) 

A 强自由主义 

—0. 606 

-0.413 

—0. 403 


(0. 124) 

(0. 111) 

(0. 043) 

自由主义 

一 0 . 275 

— 0 . 386 

—0. 403 


(0. 115) 

(0. 083) 

(0. 043) 

弱自由主义 

一 0 . 158 

一 0. 269 

—0. 279 


(0. 113) 

(0. 084) 

(0. 082) 
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(续表) 




模型6 

模型7 

模型8 


中间取向 

0. 065 

0. 027 

— 0. 002 



(0. 072) 

(0. 057) 

(0. 047) 


强保守主义 

— 0. 051 

— 0. 056 

_ 0. 002 



(0. 100) 

(0. 077) 

(0. 047) 


保守主义 

0. 512 

0. 494 

0. 492 



(0. 104) 

(0. 084) 

(0. 084) 


弱保守主义 

0.514 

0. 601 

0.597 



(0. 125) 

(0. 086) 

(0. 087) 


过少 

—0. 607 

— 0. 580 

_ 0. 569 



(0. 076) 

(0. 084) 

(0. 087) 


恰好 

— 0. 169 

—0. 207 

_ 0. 222 



(0. 111) 

(0. 116) 

(0. 117) 


过多 

0. 776 

0. 788 

0. 791 



(0. 035) 

(0. 032) 

(0. 030) 


注:括 号中的数值为渐进标准误。 


例 3. 2:偏关联模型 

表 3. 4展示了 3个关于生活满意度指数的交互情况。它们是家庭满意度、 
家庭居住满意度和业余爱好满意度，分别对应行、列和层变量。每一个变量都 
分为4个类别:1表示不满意，2表示比较满意，3表示满意，4表示非常满意。总 
共有1509个个案。这张表从1977年综合社会调查数据中获得并且已经被克洛 
格 (1982 b ) 详细地分析过了。下面的再分析将提供关于这3个变量之间关系的 
新的、更优的理解。 

完整的独立模型(表 3. 5的第一行)生成了 54个自由度和等于544的 L 2 , 
并且清楚地表明，这3个生活满意度的指数以一种系统的方式相互关联。 
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表 3. 4关于生活满意度3大指数的交互情况 


L = 

R = 

C = 1 

C = 2 

C = 3 

C = 4 

1 

1 

76 

14 

15 

4 

1 

2 

32 

17 

7 

3 

1 

3 

64 

23 

28 

15 

1 

4 

41 

11 

27 

16 

2 

1 

15 

2 

7 

4 

2 

2 

27 

20 

9 

5 

2 

3 

57 

31 

24 

15 

2 

4 

27 

9 

22 

16 

3 

1 

13 

6 

13 

5 

3 

2 

12 

13 

10 

6 

3 

3 

46 

32 

75 

20 

3 

4 

54 

26 

58 

55 

4 

1 

7 

6 

7 

6 

4 

2 

7 

2 

3 

6 

4 

3 

12 

11 

31 

15 

4 

4 

52 

36 

80 

101 


注 :变量 L 、 R 和 C 分别表示业余爱好满意度、家庭满意度和家庭居住满意度。变量编码是 1( 不满 
意）、 2( 比较满意）、 3( 表示满意)和 4( 非常满意）。 

资料来源 :这张 表曾由克洛格 (1982 b : 表 3) 分析过，并且是从1977年综合社会调査数据中获得的。 


第二行至第五行的模型生成了一系列由克洛格 （1982 b ) 报告的模型来解释 
这3个指数间的关系。模型2将所有二元交互参数分解成一维的偏关联要素 
(详情见公式 3. 10)。即使当前模型的拟合优度统计值相对于完全独立模型有 
了显著的改善，但它明显无法很好地拟合数据 (39 个自由度， L 2 等于109)。 


表 3. 5适用于表 3. 4的偏关联分析 


模型描述 

df 

L 2 

BIC 

A 

mm 

1. 完全独立 

54 

544. 37 

149. 13 

23. 73 

0. 000 

2. 非受限 RC (1) + RL (1)+ CL (1) 

39 

109. 23 

-176. 22 

9.81 

0. 000 

3. 带有一致数值约束的受限 RC (1) + 
RL (1)+ CL (1) 

45 

123. 70 

一 205. 66 

10. 90 

0. 000 

4. 准确拟合单一性单元格的非受限 
RC (1)+ RL (1)+ CL (1) 

35 

37. 68 

—218. 49 

4. 63 

0. 347 
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( 续表 ) 

模型描述 df L 2 BIC A 


5. 带有一致数值约束和准确拟合单一 
性单元格的受限 RC (1) + RL (1) + 
CL (1) 

6. 完全二元交互 

7. 准确拟合单一性单元格的完全二 
元交互 

8. 在所有偏关联中的非受限一致和 
对数乘积关联模型 u RC + rc ( i ) + 
Url + RL (1)+ U cl + CL (1) 

9. 带有单一性行数值的模型8 

10. 带有单一性列数值的模型8 

11. 带有单一性层数值的模型8 

12. 模型9 + U RL = U CL 

13. 带有单一性数值约束的模型8 

14. 模型 13 + Url ^ Ucl 

15. 模型 14- CLC 1) 


41 

49. 15 

一 250. 93 

5. 50 

0. 179 

27 

29. 00 

-168. 62 

4. 86 

0. 361 

23 

21. 93 

-146.41 

3. 70 

0. 524 


36 

45. 85 

-217. 64 

6. 25 

0. 126 

38 

47. 13 

_ 231. 00 

6. 25 

0. 147 

38 

50. 90 

-227. 23 

6.31 

0. 079 

38 

53. 63 

一 224. 50 

6. 58 

0. 048 

39 

48. 57 

一 236. 88 

6. 57 

0. 140 

42 

55.07 

— 252. 34 

6. 69 

0. 085 

43 

55. 96 

-258. 77 

6. 82 

0. 089 

44 

55. 98 

一 266. 06 

6. 83 

0. 106 


当这个模型在行、列和层数值上具有单一性数值约束时(公式 3. 11)，它看 
来似乎与数据相当一致了，但是这个模型的总体拟合程度仍然不能令人满意。 

克洛格 (1982 b ) 推测，以上模型无法提供令人满意的结果的主要原因在于 
交互表格中的 4 种单一性单元格，即（1，1， 1),(2, 2, 2),(3, 3, 3) 和(4, 4, 4) 
单元格。换言之，将这3个生活满意度指数一致地列为满意或者不满意的个案 
与总体的情况非常不一样。事实上，当所有这4个单元格完全被屏蔽或者完全 
被拟合后，克洛格 （1982 b ) 才能确定一些最好的描述这种关系的关联模型。现 
在，它们重新出现在第四行和第五行。这两个模型的主要差异在于，后者除了 
屏蔽单一性单元格外，还在不同偏关联的行、列和层数值上添加了单一性数值 
约束。尽管这两个模型的拟合优度统计值(分别为35个自由度， L 2 等于 37. 78 
和41自由度， L 2 等于 4 9. 15) 都是令人满意的，但是我们或许会回顾一下，首先 
看看这样的处理是否真的与数据相一致。 

关于屏蔽 4 种单一性单元格的模糊假设是，假设存在涉及这些单元格的3 
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个生活满意度指数之间的三元交互项。这一假设在什么程度上与数据一致呢? 
第六行和第七行的模型为我们提供了关于这一问题的直接答案。基于检验统 
计值，到目前为止，读者并不能拒绝与任何之前讨论过的模型相比， FI 模型（第 
六行)是最优模型这一假设。它拥有27个自由度， L 2 等于29,且在统计上并不 
显著。与之相似，准确地拟合单一性单元格时，重新估计的 FI 模型(第七行）同 
样提供了令人满意的结果。事实上，这两个模型在拟合优度统计值上的差异表 
明，与克洛格 (1982 b ) 的处理方式相反，这4种单一性单元格并不是导致背离完 
整二元交互的真正原因。因此，克洛格的模型(第四行和第五行)提供了一个不 
完整的影像，甚至还会扭曲生活满意度3大指数之间的关系。 

为了完整地捕捉所有3个偏关联要素的复杂性，更好的做法是增加这3个 
偏关联项的维数。第八行通过为每一项偏关联加人单一性关联要素，从而引人 
了二维关联参数。这一模型使用了 3个自由度，生成了 36个自由度和等于 45. 85 
的 L 2 。 令人满意的是，这一结果在 0. 10显著水平上可被接受。接下来的3个 
模型(第九行至第十一行)尝试检验一些行、列和层数值是否真的在不同偏关联 
要素上保持一致。结果显示，只有单一性行数值约束似乎与数据相一致(第九 
行)。在模型9的条件下，第十行进一步增加约束条件，即在 RL 和 CL 之间的偏 
单一性关联参数是相同的，结果表明，这是肯定的。模型13反而在行、列和层数 
值上添加单一性数值约束。相对于模型8,模型13获得了 6个自由度和等于 
9. 22( p = 0. 16) 的 AL 2 ，它更值得选择。基于对报告的参数估计值的仔细检查， 
在 RL 和 CL 关联中的单一性数值关联参数似乎是相等的。于是这一假设在第 
十四行中得到检验，导致在拟合优度统计值上的微小改变。最后，这些估计值 
进一步表明，没有必要添加对数乘积要素来解释 CL 偏关联。相反，通过在 CL 
偏关联要素中的单一的单一性关联参数 （ U CL ) 便足以获得 CL 偏关联。第十五 
行中的拟合优度统计值再一次证实，这一假设事实上是与数据相一致的，并且 
不能被拒绝。 

因此，尽管包含二维混合(对数线性和对数乘积)偏关联模型，但我们最终 
拥有3个可选择的模型设定来理解这3个生活满意度指数间的复杂关系。它们 
十分不同于克洛格 （1982 b ) 早先报告的模型。他的首选模型事实上比这里展示 
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的模型更加复杂，因为并不存在关于这3个指数之间的三元交互情况的实证支 
持。当然，这并不意味着这3个指数之间的偏关联模式是简单的。 

为了全面理解复杂的偏关联模式，表 3. 6提供了模型9、模型12和模型15 
中的参数估计值和它们的渐进标准误。由于从这3个模式中得到的估计值之间 
的差异很小，它们描绘了这3个生活满意度指数之间相对简单的关系。这3个 
模式均指向所有偏关联之内的二维关联模式的重要性，除了在模式15中，家庭 
居住满意度和业余爱好满意度之间的偏关联可以通过一个单一的偏单一性关 
联参数 ( U CI .) 获得。相对于家庭满意度和家庭居住满意度之间的偏内在关联系 
数 (<|>rc = 0.6), 家庭满意度和业余满意度之间存在特别强的偏内在关联性 
4 rl = 1. 1)。尽管 <|> CL 的参数估计在模型9和模型12中是统计显著的，但在 CL 
偏关联中，多数被估计的列和行数值参数分别为 V ;和，，拥有很大的渐进标准 
误，并且在统计上是不显著的。这强调了为什么在模型15中，删除对数乘积 


RL 偏关联并不会导致拟合程度的显著下降。 

表 3. 6适用于表 3. 4的偏关联模型经由选择的参数估计值 




模型9 

模型12 

模型15 

RC 偏关联 





U RC 


0. 134 

0. 133 

0. 133 



(0. 025) 

(0. 025) 

(0. 025) 

(j>RC 


0.661 

0. 640 

0. 642 



(0. 140) 

(0. 137) 

(0. 138) 


不满意 

0. 561 

0. 538 

0. 544 



(0. 079) 

(0. 079) 

(0. 078) 


比较满意 

— 0. 593 

_ 0. 598 

— 0. 598 



(0. 070) 

(0. 069) 

(0. 069) 


满意 

— 0. 392 

— 0. 389 

— 0. 388 



(0. 084) 

(0. 084) 

(0. 084) 


非常满意 

0. 424 

0. 449 

0. 443 



(0. 089) 

(0. 085) 

(0. 085) 

Vj 

不满意 

0. 160 

0. 181 

0. 172 



(0. 146) 

(0. 151) 

(0. 150) 
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(续表) 




模型9 

模型12 

模型15 


比较满意 

-0. 736 

— 0. 742 

-0. 745 



(0. 089) 

(0. 089) 

(0. 086) 


满意 

—0. 076 

—0. 081 

_ 0. 068 



(0. 157) 

(0. 160) 

(0. 154) 


非常满意 

0. 653 

0. 641 

0. 641 



(0. 109) 

(0. 114) 

(0. 113) 

RL 偏关联 





Url 


0. 248 

0. 224 

0. 229 



(0. 025) 

(0. 016) 

(0.016) 

今 RL 


1. 137 

1. 140 

1. 138 



(0. 140) 

(0. 137) 

(0. 137) 


不满意 

0. 561 

0. 538 

0. 544 



(0. 079) 

(0. 079) 

(0. 078) 


比较满意 

— 0. 593 

— 0. 598 

一 0. 598 



(0. 070) 

(0. 069) 

(0. 069) 


满意 

— 0. 392 

— 0. 389 

—0. 388 



(0. 084) 

(0. 084) 

(0. 084) 


非常满意 

0. 424 

0. 449 

0. 443 



(0. 089) 

(0. 085) 

(0. 085) 


不满意 

0. 051 

0. 045 

0. 048 



(0. 090) 

(0. 089) 

(0. 089) 


比较满意 

— 0. 662 

_ 0. 662 

_ 0. 658 



(0. 060) 

(0. 059) 

(0. 060) 


满意 

一 0. 126 

-0. 122 

一 0. 130 



(0. 090) 

(0. 085) 

(0. 084) 


非常满意 

0. 737 

0. 738 

0. 740 



(0. 049) 

(0. 049) 

(0. 048) 

CL 偏关联 





Ucl 


0. 203 

0. 224 

0. 229 



(0. 023) 

(0. 016) 

(0. 016) 

令 CL 


0. 284 

0. 276 

— 



(0. 101) 

(0. 102) 


Vj 

不满意 

-0. 337 

-0. 278 

— 



(0. 301) 

(0. 308) 
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(续表) 



模型9 

模型12 

模型15 

比较满意 

— 0. 089 

—0. 140 

— 


(0. 361) 

(0. 370) 


满意 

0. 841 

0. 848 

— 


(0. 089) 

(0. 080) 


非常满意 

~~ 0. 415 

_ 0. 430 

— 


(0. 323) 

(0. 323) 


T]k 不满意 

— 0. 090 

0. 017 

—— 


(0. 361) 

(0. 368) 


比较满意 

— 0. 621 

— 0. 652 

— 


(0. 240) 

(0. 230) 


满意 

0. 776 

0. 749 

— 


(0. 152) 

(0. 180) 


非常满意 

— 0. 065 

-0. 114 

— 


(0. 323) 

(0. 332) 



注:行 、列和层变量分别为家庭、居住和业余爱好满意度。括号中的数值为渐进标准误。 


另一个重要的观察是，这3个指数被估计的行、列和层数值(分别为 &、 Vj 
和 T ) k ) 并不具备一个好的单调排序。这解释了为什么所有在偏关联之内只包含 
一维关联要素的这些模型无法提供令人满意的拟合。在克洛格 （1982 b ) 的例子 
中，他主观地确定了 4种单一性单元格以获得令人满意的结果。因而，他错误地 
推断在这3个指数之间存在一个简单的线性关系，但事实上的偏关联模式比这 
复杂得多。所以，“生活满意度其中一个指数的高水平是与其他方面的高满意 
度相关的”这个简单的观点是站不住脚的。 


第 4 章 I 条件关联模型在三向交互表上的应用 

娜平 ㈣ 斧啊曽 獅钟纖嫌臟 纖 瀲 ;讎 


对于大多数社会科学的应用来说，它们的分析往往涉及二元或者三元(或 
者多元)的交互项。比如，如果层变量是一个分类变量，我们会希望知道行变量 
与列变量的相关性是否在分类变量的整个范围内是不变的。在此需要重申的 
是，分类变量是按照最宽泛的方式定义的，它可以指一个或多个变量。如果行 
变量与列变量的相关性在分类变量的整个范围内是变化的，那么，我们就需要 
通过模型化可提供的实质性解释的要素来进一步简化我们的认识。例如，运用 
线性或二次趋势约束以及/或者类 ANOVA 分解方法 (Wong，1995)。 但是，如 
果层变量不是一个类别变量，并且我们感兴趣的是复杂的三元或者多元相关， 
那么，三模型关联或相关模型则更合适 （Anderson， 1996； Siciliano & Mooi- 
jaart, 1997； Tucker, 1966; 关于一些受限三模型关联模型与一些条件关联模型 
之间关系的讨论，请参见 Wong， 2001)。但是，因为篇幅的限制，我对后者不予 
讨论。 

与之前章节所介绍的部分相关模型不同，我们特别感兴趣的是在层变量的 
条件下，行变量与列变量之间的相关性。而它们却把行变量与层变量、列变量 
与层变量之间的关系看做枯燥无味的，与之相对应的参数也因此未被分解。从 
理论上来说，我们这一章所讨论的模型种类被称为“条件关联模型”。它们能够 
提供许多有趣的方式捕捉条件独立模型中的偏离，并具体指岀组间差别在哪里 
(Becker, 1989a、1989b、 1990； Becker & Clogg，1989； Clogg, 1982a、1982b； 
Clogg Shihadeh, 1994； Erikson & Goldthorpe, 1992； Goodman 8^ Hout， 
1998、 2001 ； Wong， 1990、1992、 1995； Xie, 1992； Yamaguchi，1987) 0 
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条件独立或者条件 RC(O) 模型 

假设现在有3个变量 A 、 B 和 C 来代表相应的行、列、层，并且变量 c 是类 
别变量。与之前在第3章中展示的类似，条件独立 ( CI ) 模型(与方程 3. 3进行比 
较)可以被写成如下 形式： 

logF ijk = X + Xf+ Xf+ ^ + Xf k c + Xf k c [4. 1] 

且有 X〗 B = # k Be = 0。在这样的规定下，模型假设在控制了变量 C 之后，变量 A 
与变量 B 之间不存在相关关系。换句话说，之前在汇总表中观测到的 A 和 B 之 
间的相关性大多是虚假的，实际上是由变量 C 造成的。条件独立模型有 （I 一 
1)( J 一 1) K 个自由度。鉴于公式 4. 1并没有包含任何对数乘积行效应部分与列 
效应部分，它也可以被称为“条件 RC (0)” 模型。根据第3章的内容，基于 C 得 

到的 A 和 B 的条件局部对数优比与在条件独立的情况下得到的条件局部对数 
优比有相同的 结果： 


log 0ij(k> = log 0 ijk = 0 


[4. 2] 


同类或恒定的关联模型 


如果我们只是添加限定条件 X ^ = 0, 公式 4. 1 就变成了常规的多项或者 
双向互动的线性对数模型(或者是公式 3. 9中的 FI 模型）。这个模型也被称为 
“相同的”或者“恒定的”关联模型，因为它假设在行变量与列变量中找到的非特 

定的关联模式并不会在不同层中变化。换句话说，这个模型假设恒定的发生比 
在不同层级中是不变的，可以被表述为： 

log Fijk — X + X, A + \f + Xk + H - Xf k c + [4. 3] 

并且相对应的条件局部优比以及条件局部优比的比率如下 所示： 


log 0ij(k) ~ l°g 9ij 


[ 4 . 4 ] 
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和 


log ftjk = 0 


其中 ， i = 1，…， I， j = 1 ，•••，】， k = 1，…， K 。 模型的自由度为 （I — 1 KJ — 
1)( K — 1)。 


三元交互作用或者饱和模型 


最后，当# 8 和 X 〗 k Be 两项都被包括进去的时候，模型完全饱和，自由度为0。 
三元交互或者饱和模型可以表示如下： 

log F ijk = X + Xf 1 + Xj B + Xk + + + X^ B + X^ k BC [4. 5] 

以前的研究者往往在经验研究中是选择公式 4. 3 还是公式 4. 5的问题上进 
退两难。一方面，根据常规的统计检验理论，常数关联模型相对于自由度的拟 
合优度统计值通常并不令人满意，所以饱和模型会被认为更优。这在样本量特 
别大的时候更是如此。但另一方面，其他模型选择策略，诸如 BIC 和 AIC ， 为了 
遵循科学性的简约而更偏好恒定关联模型。事实上，研究者发现，这两个对数 
线性模型都是错的，不选某一个错误的模型而选另一个错误的模型并不是一个 
正确或者可靠的策略。因为“正确”的模型介于两者之间，我们需要发展一个足 
够强大的中介性统计模型来定位组与组之间的差异，同时分开并区分相关程度 
(组间差异）中的不同模式(结构）。比如，我们会发现一个非常有趣的现象，相关 
程度却可以在不同组间发生变化。 


模拟组间差别的层效应模型 


用以检验组间差别的第一组模型被称为“层效应模型 ” （Erikson & Gold - 
thorpe ， 1992； Goodman & Hout , 1998、 2001 ； Wong , 1990、 1992； Xie , 1992； 
Yamaguchi , 1987)。 研究者有一个共同的特征，那就是在每层都使用统计上强 
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大的1个自由度检验来检测组间差异。在大多数情况下，他们通常不会假设一 
个明显的相关结构或相关模式。然而，后一个观测主要是在实际应用中有局 
限，而不是其存在固有缺陷（更深人的讨论，请参见 Goodman & Hout , 1998； 
Xie ， 1998； Yamaguchi , 1998)。 它们之间的主要区别在于，它们对于层级间的 
差异有不同的规定。 


对数线性层效应模型 （ LU )( Wong ， 1990； Yamaguchi , 1987) 是第一个被 
提岀用于检测组间差距的中介性统计模型。它假设行变量与列变量都有序列 
特征，或者套用统计上的术语来说，行变量与列变量之间的关联模式是等向性 

的。[ 14 ]这个模型也被称为“对数线性单一性差异 模型” （ Wong ， 1994)，并可被 
写为： 

log F uk = X + Xf + Xf+ Xk+X^ C + ^ + Xf 十 PkUiVj [4. 6] 


这个模型的自由度为 （ I —1)( J —1)( K —1) —( K —1) = ( U — I — JKK —1)。 
在公式 4. 6 中，并不是所有的参数 p k 都可以唯一识别。常规标准化的方法是设 
(3i = 0 。 经过这样的标准化处理， p k 可以代表从层 1( 基准组)到层 k 在同一组中 
的优比的离差。公式 4 . 3 与公式 4 . 6 的似然检验数据差异产生了一个自由度为 
K 一1的卡方值。这种在统计上功能强大的检测方法令研究者得以确认组间差 

别的存在。基于公式 4 . 6 , 层效应对数线性模型假设在条件局部优比中存在下 
列 关系： 


log 0 ij(k) = log 0 ij + p k [4. 7] 

因此，对于每一个类别来说，完整的一组优比因其乘积项私的不同而不同。 
在公式 4. 7 中，它可以通过对比层级 k 和层级 V 被清楚地展现 岀来： 


及 


log 0 ij ( k ) — log 0 i j(k ') = p k — 〜 


[4. 8] 


log 8 ij ( k ) _ log 9 ij + J 3 k 
log log 0 ij + ^ 


[4. 9] 


换句话说，当条件发生比对数比的比率不能被化约为更简单的项时，条件 
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发生比对数比之间的差别可以被简化为统一的差异。需要注意的是，前者与在 
公式 3. 3中定义的局部优比是相等的。公式 4. 8所描述的关系也解释了它被称 
做“对数线性单一性差异模型”的原因。此外，这个模型也与在第2章被讨论过 
的单一性关联模型紧密相关。 

第二层效应模型假设差异是对数乘积的，而不是层与层之间乘积项与对数 
相加项之间的差异，于是它就成了对数乘积层效应模型 ( LL 2 ), 这在社会流动的 
比较研究中也被广泛地称为 “ UNIDIFF 模型” （ Xie ， 1992; Xie & Pimentel , 
1992； Erikson & Goldthorpe ，1992)。 与之前的公式表达不同，它对行类别与 
列类别并没有做顺序的规定，表达式可以写成如下 形式： 

log F ijk = X + Xf + Xf + Xk + + + [4.10] 

其中，咖代表变量 A 与变量 B 之间的完全交互。这里的参数伽在限制条件 
2咖= S 水 =0的情况下可以被识别，而参数扒则是在限制条件 = 
1成立的情况下可以被识别。模型的自由度为 ( I -1)( J -1)( K -1)- 
( K - l ) =(U — I — J )( K — 1)。与对数线性层效应模型的情况类似，公式 4. 3与 
公式 4. 10的对数似然检验系数也产生了一个自由度为 K 一 1的卡方值以检测 
组间差异。在上述规定之下，条件对数优比可以写成下列形式： 

log 0 ij ( k ) =令 klog 0 u [4. 11] 

因此，对每一个类别来说，完整的一组优比因乘积项 Pk 的不同而不同。在 
公式 4. 11中，它可以通过对比层级 k 和层级 V 被清楚地展现出来。条件发生 
比对数比的差异与条件发生比对数比之间存在如下 关系： 

log 0 ij ( k ) — log 0 i j ( k ，） = (</>k — j > k ') log 0 ij 
及 

log 8 ij ( k ) _ 

log 0 ij ( k ') < j > k r 

公式 4. 12 和公式 4. 13 表明，条件发生比对数比的差异不能化约为较简单 
的项，而在层 k 中 ，一 对单元格的条件发生比对数比与该对单元格在层 V 中相 


[4.12] 

[4. 13] 
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对应的条件发生比对数比的比率是一个常数。这就证明了层与层之间本质上 
的差异是对数乘积的而非对数相加的。 

如果对数线性模型与对数乘积层效应模型都不能提供令人满意的结果，第 
三个层效应规定就假设了一种更复杂的公式化过程——修正的类回归层效应 
模型 ( LU)(Goodman & Hout , 1998、2001)。这个模型与上面提到的对数乘积 

层效应模型有很多相似之处，唯一的不同是，它包含了 这个项。其表达式可 

以写成如下 形式： 


log F ijk = X + + Xf + + Xf k c + Xf k c + + ^ ^ [4. 14] 

这个模型的自由度为 （ IJ 一 I 一 J)(K 一 2)。 根据古德曼和豪特 （1988) 的研 
究，其条件对数优比可以写成如下 形式： 


log 0ij(k) = 6ij +5ij^>k 

[4. 15] 

其中， 


^ij = ^ ij B + Xm , j+1 — j — x ^ +1 

[4. 16] 

及 


? ij = ^ij + 少 i+1 ， i+1 — 中 i+1，j — 咖， i+1 

[4. 17] 

上述规定与最小一乘法 ( OLS ) 的规定 E(y 1 X) = Po +Pix 有很多相似之处。根 
据上述公式化过程，在比较层 k 与层 V 的时候，条件对数优比之间的差异与条 
件对数优比之间的比率可以写成如下 形式： 

log 0ij ( k> — log 0 iKk ，） = ?ij(^>k — (J>kO 

[4. 18] 

及 


log ftj (k ) + ^ [j < j> k 

log 0ij(k ’） G 今 k ， 

[4. 19] 


从公式 4 . 18和公式 4. 19可以看出，条件对数优比之间的差异与条件对数 
优比之间的比率对于不同的 i 、 j 来说都是不同的。相反，对数优比中层间差别 
的比率都是成比例的。表达式如下： 
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log 9ij(k> — log ftj(k，) = j>k — <t>k f [ 4 20 ] 

log 0ij(k) — log 0iKk.) 今 k — 小 k. 

其中， k 关 kW 。 [ i 5 ] 这种类回归方法的好处包括 :（1) 尽管建立了关 

联的基准模式，但扣和如在层 k 上调整了这种基准 模式; （2) 由建立的关联 
基准模式。比如，我们可以运用完全交互、单一性关联、 RC 关联、拓扑模型等来 
分别或同时约束 X 〗 B 与如 （ Xie ， 1998； Yamaguchi , 1998)。如果要在层级之间 

做有意义的比较， LL 3 下最少要包含3个层级。 


模拟组间差别的关联模型 


当它们能提供就自由度而言令人满意的拟合值时，上述层效应模型就可以 
提供在统计上非常强大的检验来测量组间差异。如果它们不能，我们可以通过 
扩展到之前章节所讨论的关联模型来模拟组间差异。与我们之前的讨论类似， 
后者可以被粗略地划分到两个特定的类别中：（1)关联结构是否可以在对数线 
性项或者对数乘积项中被体现出来（比如混合模型）；（ 2 )关联的复杂程度是单 
一维度或者多维度的 （ Becker ，1989 a ； Becker & Clogg , 1989? Wong , 2001)。 

当然，同时包含对数线性部分与对数乘积部分的混合模型必然至少是两维 
度的。 


对数线性设定 ：（ R + C )— L 模型 


下面的讨论不会对多表格中不同对数线性公式化过程的应用做全面讲 
解，相反，重点会特别放在对数线性的行与列效应 （R + c ) 的规定。这个讨 
论可以被轻易地扩展到其他模型中，比如 u 、 R 和 C ， 但因为篇幅的原因，我 
将不做这样的扩展。[ 16 ]接下来我会简略地说明，对数线性行与列效应模型 
(R + C ) 在多表格中的应用是和与其相对应的对数乘积模型 （ RC ) 非常类 
似的。 

为了与贝克尔 ( Becker ，1989 a ) 以及贝克尔与克洛格 （1989) 研究中使用的 
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术语保持统一，多表格中的对数线性行与列效应模型被归类为 （R + C ) — L 模 
型。该项前半部分与与之相关的关联模型类别是相对应的，而该项的后半部分 
则与层变量的条件关联相对应。同惯例一样，字母 R 、 C 和 L 分别代表行、列与 
层变量。同质对数线性行与列效应模型是这种规定中最简单的形式。需要注 
意的是，在这里，“同质”指的是行效应与列效应在所有级别的层变量中相 

等。[ 17 ]然而，“异质性”这一术语指的是特定层下的行与列效应。同质模型可以 
表达 如下： 


log F ijk = X + + Xf + X ^ + Xf k c + Xf k c + ^ UV .+ rfV.+rfUi [4.21] 

其中， U 与 兄 分别是行与列数值中固定的整数。为了识别参数与 T f ，如下 
的标准化是必 需的 ： rf = rf = rf = Tj B = 0 o 因此，这个模型的自由度为 （I — 
1 KJ - DK -(1-2)-( J -2) — 1 = UK —( K +1)(1 +J —1)+2。 这是之前 
讨论过的常数关联模型(公式 4. 3) 的一种特殊形式，因为它假设在关联中没有 

系数交互或者没有层级差异。其部分的或条件优比 0 ij ( k ) 与局部优比可以写成如 
下 形式： 

logSij ( k ) = ( j > + — rf ) + ( rf +1 — rf ) [4. 22] 

及 

log 0 ijk = log 0 ij ( k+u — log 0 ij(k) = 0 [4. 23] 

需要注意的是，上述条件优比并不包含 log 0 K j ) k 或者 log 0 (i)ik ， 因为它们不能被进 
一 步简化，并且包含 AC 与 BC 交互作用的额外的局部 X 参数。 

如果我们允许关联 ({) 以及行参数与列参数 ( Ti 与 Tj ) 在 k 的不同层级中变 
化，公式 4. 21就变成了不同质模型(有三因素交互作用）。不同质的 (R + C )— 
L 或者 R + C 模型可以被表示为如下形式： 

» log F ijk = X + + + X ^ + X^ k c + Xf k c + V 』 + r^Vj + rf^Ui 

[4. 24] 

以下标准化方式被采用 ： 4 … = T f K =： 4 = … + T & = = 0， 
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并且该模型的自由度为 （I _ 1KJ — 1)K - (I - 2)K — (J 一 2)K — K = 
(I 一 2)(J — 2 )。 在这种情况下，偏条件优比 0 iK io 以及局部优比 0 ijk 可以被写成如下 
形式： 

log 0 ij ( k ) = <}>k + ( k — Tii c ) + ( r ^ i , k — rf k L ) [4. 25] 

及 

log 0 ijk =( 今 k+l —今 k ) + ( k+ i + T^ C 一 k — T ^ k+1 ) + 

[4. 26] 

/ BC 丄 BC — BC — BC \ 

、 Tj+l, k-fl I Tjk — Tj+i, k — Tj, k-H ) 

log 0 iQk 与 log 0 ⑼ k 都包含 AC 与 BC 交互作用的局部参数 X 以及对数线性 
行效应与列效应的成分，同时，它们不能被进一步简化。 

当上述模型中的一个能够给出理想的结果，比较它们的拟合值就可以为求 
解行效应与列效应的总变化提供宝贵的信息。根据之前所提出的层效应模型 
的逻辑，我们可以提出一个中介模型来使用自由度1检验 (1 自由度检验法），从 
而捕捉层间差异。使用贝克尔 （1989 a ) 以及贝克尔与克洛格 （1989) 研究中提出 
的术语，这些模型被称为“局部不同质”或者“局部同质”的 （R + C ) — L 模型。 
具体来说，那种假设同质行效应与列效应参数存在于公式 4. 2最后两部分的不 
同层级间，但特别层效 应在+ 的模型中是受到特别关注的，它可以被 写成： 

log Fjjk = + Xf + Xk + Xik C + Xf k c + <(>kUiVj + rf Vj + rfUi [4. 27] 

其自由度为 UK —( I + JKK + l ) +4。在这样的情况下，条件与局部优比可以被 
分别写成如下 形式： 

log 0 ij ( k ) =和 + ( r^i — rf ) + ( zf + i — Tj B ) [4. 28] 

及 

log 0 jjk = log 0 ij ( k + i ) — log 0砂） =</> k+i — < J>k [4. 29] 


换句话说，上述模型把所有的层差异转化为了单一参数 “， 却保持行效应 
参数与列效应参数为常量。这样的表达形式清楚地表明，上述模型是之前所讨 
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论过的对数线性层效应模型的一种特殊形式。尽管公式 4. 28中的最后两项“对 
数线性行效应与列效应的差异”代表了一种普遍的关联模式或者关联结构 ，和项 
却代表了不同级别上的关联。其他局部同质模型也是可行的。比如，假设只有 
列效应是在不同组别变量中保持恒定的模型，其表达式可以表达 如下： 

log F ijk = X + Xf + Xf + + Xf k c + Xf k c + + rfV , + rfU ； 

[4. 30] 

而假设只有行效应在不同组别变量中保持恒定的模型有类似的表达 方式： 

log F ljk = x + 入 f + 入 f + < + + 4 C + 扒 以 Vj + # V 】 + r f k c U 

[4.31] 

需要注意的是，在两个模型中， 和是 共变的，因为仅仅允许行效应或列效应 
的参数变化，却不允许其关联程度 (和 ) 也随之发生变化的做法是不符合逻辑的。 
与公式 4. 27相比，公式 4. 30使用了额外的 （I 一 2 )(K — 1) 个自由度，而公式 
4. 31则使用了额外的 （J 一 2 )(K — 1) 个自由度。因此，公式 4. 30的自由度为 
( J -2 KIK - K -1), 而公式 4.31 的自由度为 （I — 2 )(JK —K — 1)。 

当公式 4. 27 所表示的模型与数据非常匹配，同时类别变量能反映岀时间序 
列时（比如，调查年份或者岀生同期群），我们就可以假设内在关联参数(和)能表 
示下降、上升或者非线性的趋势 ( Wong ， 1995 ； Wong & Hauser, 1992 )。 比如， 
线性或拋物线模型中的和会被分别写成以下 形式： 

<j>k = ^>( 1 + at) [4. 32] 

及 

i>k = ☆ ( 1 + at + bt 2 ) [4. 33] 

如果需要比较上述两种模型设定的同质部分与异质部分，我们可以通过比 
较卡方值的差异来判断参数如是否真的随时间或者世代发生改变。当然，如果 
在层变量中有足够的观测单位，我们甚至可以包括其他参数性规定，如齿条线 
回归函数。 
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如果层变量中包含两个或更多变量，如性别和种族，就可以将参数扒分解 
为类 ANOVA 的成分 (Raymo & Xie ， 2000； Wong ， 1995)。为了简便起见，假 

设只有两个层变量 U 和 U ，并分别包含 M 与 N 个类别。完全交互模型对于公 
式 4. 27中的和， 则有： 


<t>k : 

= ^mn 

[4. 34] 

然而，同质 (R + C) — L 模型则假设 

<(>k 

= 

[4. 35] 

一些中介公式特别 有趣： 

</>k ~ 

^>m ~ l - 

[4. 36] 

<}>k 

= <}>m 

[4. 37] 

<j>k 

— <f>n 

[4. 38] 


公式 4. 36到公式 4. 38并不像在公式 4. 34中那样规定扒是全互动的， 
相反，它们的规定有额外的限制。它们因为附加部分数量的不同而不同。 
只要对它们的拟合值进行比较，我们就会知道其内在关联参数是否可以以 
更简单的形式被表达出来。当然，当层变量同时体现时间顺序和多个组别 
(比如，民族与性别或者国家与性别）时，我们可以同时设定两种约束，从而 
确定跨表变异的来源。这些约束可以被用在之前所有的层效应模型以及任 
何即将被简略讨论的包含如或与一维或多维 RC 关联模型中的1自由 
度检验中。 


对数乘积 规定: RC ( M ) — L 模型 


对于同样的标记，我们可以扩展上述办法，从而像条件关联模型那样加入 
对数乘积的行与列部分。为了更好地进行说明，下面的讨论会从最一般的形 
式——多维 RC 条件关联模型，即 RC ( M ) — L ——开始。让我们采用与之前相 
同的术语， RC ( M ) 项的前半部分与多维 RC 部分相对应，而该项的后半部分则 
表示这个模型在层变量 L 上是条件的。最恰当的建模策略是，首先确定需要多 
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少维度才能正确理解对条件独立性的偏离，当维度被确定之后，再确定在不同 
的对数乘积部分，变化从何而来。 

我们将从两个极端的模型开始讨论，它们为同质 RC ( M ) — L 模型与不同 
质 RC ( M )— L 模型。而 M 值可以在0与 min (1—1， J —1) 之间变换，即存在 
0< M < min ( I - l , J 一 1)。当存在]\4= 0时，该模型与条件独立模型等同， 
而当 M 在同质方程中取最大值的时候，它则会与完全二元关联模型或者恒定 

关联模型等同。同质 RC ( M ) — L 模型或者同质 RC ( M ) 可以被写成如下 
形式： 

log F ijk = x + + xir + xf k c + xf k c +sr=i ^ju im v jm [4. 39] 

该模型的自由度为 （I 一 1)( J —1) K — M ( I + J — M —5)。 为了唯一识别 
所有的和 v jm 参数，中心化、缩放以及跨元交互约束都是必需的。换句话 
说，下列约束是必需的：= 0以及= 

X ) j=i ^ jmVjm - = S mm ^, 其中， S mm ' 是 Kronecker 符号（比如，当 m = m '时， S mm ' = 
1，否则等于 0)。 

在公式 4. 39中，同质 RC ( M ) — L 模型中的条件对数优比与条件对数优比 
的比率可以写成如下 形式： 

log 0ij(k) = 2 m=1 m 一 pm) (Vj+1, m — Vj m ) [4.40] 

及 

log 0 ijk = 0 [4. 41] 

另一方面，我们可以建立不同质 RC ( M )- L 模型，这样，所有的“、~以 
及如的得分参数就可以随着层变量 ( L ) 共变。该模型可以写成如下 形式： 

log Fij k = X + xf + xf + Xk + + xf k c + 2 ^ =1 <#> mk / ximkv jmk [4. 42] 

该模型的自由度为 （ I 一 M — 1)( J 一 M — 1)。 与之前相类似，如果想达到 

唯一识别的目的，就必须对行与列的参数进行中心化、缩放与跨元交互约束 
处理。 
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在公式 4. 42 中，同质 RC(M) — L 模型的条件对数优比与条件对数优比的 
比率都可以被写成如下 形式： 

log 0 ij ( k ) — 2 m=1 <J>mk ( 卩 i+l，mk — /Jti m k)(Vj+l， m k — Vj m k) [4.43] 


及 


log 0 ijk ~ 〉: m= 1 k4-l (jLti+1, m, k+1 — /^im, k+1 ) (Vj+1, m , k+1 — Vjm, k+1 ) _ 


> : m= i ♦mk ( /^i+1，mk pimk ) ( Vj+1，mk Vjmk ) 


[4. 44] 


表 4. 1 对不同种类的 RC ( M ) — L 条件关联模型做了一个小结。它有3 
列：模 型设定、跨元交互约束的种类以及相关的自由度。请留意，表中只展示 
了最多三维的 RC (3) — L 模型，因为一般来说，没有必要再讨论更复杂的交 
互模式了。事实上，大多数经验数据都可以被两维 RC 条件关联模型很充分 
地分析。如果这样的设定还是不能得到令人满意的结果，我们就可以添加简 
单但能被充分理解的参数来得到那样的结果（比如，研究社会流动中不流动的 
普遍性）。除了 RC (1) 模型，所有非约束 RC ( M ) — L 条件关联模型都要求跨 
元交互约束。 


表 4. 1 一些 RC ( M ) — L 模型的跨元交互约束与自由度与1 x J X K 交互分类表 


模 型 

跨元交互约束 

自由度 

1 . 同质 RC(0) 

不适用 

(I-1)(J-1)K 

2 . 同质 RC(1) 

不适用 

(I-2)(J-2)K 

3 . 同质 RC(1) 

不适用 

(I-l)(J-l)K-(I + J-3) 

4 . 异质 RC(2) 

2 I ut ilkpli2k = V JlkVj2k = 0 

(I-3)(J-3)K 


Vk = 1 ， 2，…， K 


5 . 同质 RC(2) 

2 fXil 抑 = 2 Vjl Vj2 = 0 

(I-l)(J-l)K-2(I + J-4) 

6 . 异质 RC(3) 

MilkMi2k ~ Vjlk Vj2k = 

〉 ] /ljlkMi3k = 〉 ： Vjlk Vj3k ~ 

〉: p2k fXi3k = > : Vj2k Vj3k — 0 

(I-4)(J-4)K 
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(续表) 


模 型 

跨元交互约束 

自由度 

7. 同质 RC ⑶ 

2 ^ = D ^ Vj 2 = 

( I - l )( J - l ) K -3 (I + J -5) 


= DvjlVj 3 = 



2 = D Vj2Vj3 = 0 


8. 异质 RC ( M ) 

〉 I MimkMim'k = ^ ^ Vjmk Vjm'k = 0 

( I - M -1 XJ - M —1 )K 


其中， m 尹 m ^ 


9. 同质 RC ( M ) 

> 】 MimMim’ = ^ y Vjm Vjm’ =0 

(I 一 1 )(J — 1 )K — M ( I+J — M — 


其中 ， m # m ’ 

5) 


在估计一系列 RC ( m ) 条件关联模型的时候，我们可以用它们的拟合值来 
推算需要多少个维度，才够我们理解在关联中跨层级的差异 (Becker & Clogg , 
1989)。这种特别的卡方划分策略将通过两个清楚的例子被简单讨论。在所需 
要的 RC 维度的数量确定以后，下一步就可以设定局部同质或者局部不同质的 

约束条件，从而系统地探究究竟是哪些部分 （+ mk 、 ^以和 v jmk ) 在不同层级中变 
化，而哪些则不会。 

鉴于一些经验分析牵涉到的对数乘积成分多于两个维度，我们来集中讨论 
这些情况会更加有意义。当 M = 1时，下面的局部同质或者局部不同质 rc 
(1) 一 L 模型非常有 意思： 

第一，同质的卜，不同质的 <}> 及 v j: 

log F ijk — X + + Xf + Xk + + 今 k/xiVjk [4. 45] 

这个模型的自由度为 K(I —2 )(J — 2) + (K —1)(1 —2) = (I —2 )(JK — 
K - l )。 请再一次注意，如果仅仅允许^在不同层中变化，而+却保持不变，这 
就不太符合逻辑。该模型的条件对数优比与局部对数优比如下 所示： 

log 0 ij ( k ) = ^> k (^ tH-i — k — Vjk ) [4. 46] 

及 

log 0 ijk = [</> k+i ( v m , Icfi — Vj , H - i ) — ^> k ( vH - i,k — V jk )](/ XH-1 — fli ) [4. 47] 
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第二，同质的 Vj ，不同质的 <(> 及 p : 

log Fjjk = X + xf + xf + Xk + ^ik C + ^ + ^kfXikVj [4. 48] 

这个模型的自由度为 K(I —2 )(J —2) + ( K —1 )(J —2) = ( J -2 KIK - 
K 一 1) 。 其条件或部分对数优比和局部对数优比如下所示： 

log 0ij(k) — k — |Hik)(vH-i — Vj) [4. 49] 

及 

log 0ijk = [^ld-1 (fJtH-1, ld-1 ~ P-u kfl ) — 今 k(^4fl，k 一 fXik)](v>fl — Vj ) [4. 50] 

第三，同质的化和 Vj ， 不同质的令： 

log F ijk = X + xf + xf + Xk + + ^ + 令 k^tiVj [4. 51] 

这个模型的自由度为 （ I —1 )(J —1 )K — K—(I —2) —(J —2) = UK - 
(I + J — 1 KK +1) — 1。其条件对数优比与局部对数优比为 •• 

log 0 ij ( k ) = — jLti)(v>fi — Vj) [4. 52] 

及 

log 0ijk = ( 今 krfi — 和 ） （)^k — jLti)(_ — Vj) [4. 53] 

这是一个简单的不同质 RC (1) 模型，并且可以被看做公式 4. 10 中对数乘 
积层效应模型 ( LL 2 ) 的一个特殊形式，唯一的区别是项咖现在 由⑷和 4替代。 
在公式 4. 51 中，我们可以非常容易地确认下列 关系： 


log 0ij(k) — log 0ii(k，) 

=(<j>k —— 今 — 

- fJti)(vj-H — Vj) 

[4. 54] 


log 0ij(k)— 小 k 
log 0ij(k') 今 k’ 


[4. 55] 

log 0ij(k) 

— log 0ij(k') _ — 

(j>k' 

[4. 56] 

log 0ij(k) 

— log 0ij(k*) <)>k — 

今 k* 


公式 4. 55与公式 4. 13所表示的对数乘积层效应模型是等价的，而公式 
4. 56与公式 4. 20所表示的是类回归层效应模型。换句话说，在简单的不同质 
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rc ( i ) 公式中，条件对数优比的比率与对数优比在不同层次间差异的比率是成 
比例的。 

第四是特殊情况。如果模型在第三种情况下与数据相对契合，同时层变量 
表示时间序列，就可以使用公式 4. 32 至公式 4_ 33 中列出的带有线性或者二次 

约束的模型。同样，如果层变量表示多类别（比如，民族与性别），也可以采用公 
式 4. 36 至公式 4. 38 中列出的类 ANOVA 。 

然而，将局部同质或者局部不同质约束引入二维条件关联模型 RC(2) _ L 
会产生一些冋题，这已经在其他文献中被大量讨论过了 ( Becker , 1989 a 、1989 b ； 
Becker & Clogg , 1989)。 首先，笔者 （2001) 认为，之前讨论的部分同质模型错 
误地报告了自由度，因为它们或不需要，或只需要比预期少的跨元 交互约 
束。[ 18 ]第二，之前所讨论的例子都是基于两个组别的。鉴于大多数社会科学的 
应用都需要进行多组别的比较，我们现在还不确定之前的计算可不可以推广到 
k 大于2的情况。正如我们发现的，它们中的一些只需要〗个，而不是 k 个跨元 
交互约束。两种情况都被归纳在了表 4. 2中。 


表 4. 2 RC (2) — L 模型的跨兀交互约束与自由度 

(在局部同质或局部不同质的约束情况下） 


模 


型 

跨元交互约束 

_0 

0 

r 

^Mill Mi21 

= Zj V J2 = 

Lo 

0 

l. 

^Milk4i2k 

= = 

"0 

1 

O' 

^il M>2 = 

/i Vjll Vj21 = 

Lo 

1 

o_ 

^ = 

v jlkVj2k = 

_0 

0 

o_ 

1 无 


Lo 

_0 

1 

1 

i_ 

n 

无 


Lo 

r° 

0 

0 

o_ 

01 

无 



自由度 


0 或 （I — 1)(J 一 1)K 一 2CIK+J—K—3) 
0 

0或 （I —1)( J —1) K —2( I + JK — K —3) 

0 

(I-1)(J-1)K-(I+J)(K+1)- 
2(K + 2) 

(I-1)(J-1)K-(I+J)(K + 1)- 
2(K + 2) 

( I —1)( J —1) K —( K + l )( I + J -3) 



0 


无 


(I 一 1)(J —1)K— (K+1)(1+J — 3) 
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(续表) 


模 型 跨元交互约束 


自由度 


~0 0 1 ' 
0 1 1 _ 


8 . 


"0 1 
0 1 



9. 


「0 


1 

1 


01 


10 . 



0 




S 

2 


Vjl Vj 2 = 0或 
/^till [Ji\2 = 0 

j^il 押 = 0 或 
Vjll Vj 2 = 0 

叫 ㈣ = o 
Vjl Vj 2 = o 


11 . 

12 . 


~0 

.0 

ro 



无 

无 


13. 


~1 

0 


1 



无 


(I 一 1)( J -1 )K 一 （ I + IK +2 J — 7) 


( I —1 KJ —1 )K 一 （2 I + J + JK -7) 


( I -1)( J - 1) K 一 （2 I + J + JK - 
K -6) 

( I -1 XJ - 1) K - (I + IK + 2 J - 
K -6) 

( I - l )( J - l ) K -2 (I + J + K -4) 
( I 一 1)( J _1 )K 一 （2 I +2 J + K —7) 


( I 一 1 )(J 一 1 )K 一 （2 I +2 J + K — 7) 


注:模 型中的 0 意味着组间无约束，而 1 意味着组间约束是相等的。详细解释请看文字部分。 

釆用与之前类似的格式，表 4. 2归纳了一系列局部同质与局部不同质 
RC (2) — L 模型。需要注意的是，对任何模型自由度的合理估计方法都完全遵 
循之前第2章的概述。为了最大限度地保持连续性和统一性，第一列中的模型 
完全遵循贝克尔和克洛格 (1989) 所采用的术语。行数代表维度数，而列数代表 
感兴趣的参数数量(三列分别为<}>、 A 和^)。最后，所有的条目都有0或1两种 
取值，0代表在层级间没有同质相等的约束，而1代表存在这样的约束。 

第一个模型不包含对内在关联以及行数值参数的相等约束(如 < f > mk 和 ； x imk ) ， 
但它包含在两个维度上对列得分参数 ( v jm ) 的相等约束。与预期相反，尽管交互 
分类表包含 k 个层级，但模型仅需要两个而不是 k +1 个跨元交互约束。更具体 
地来说，我们可以使 I ] i = lfXi 21 — ]=l Vjl Vi 2 = 0 ， 2 lM \ kfM 2 k — |=1 Vjl V » j 2 — 

0,或使跨元交互约束。需要注意的是，加入任何不必要的额外约束都会产生不 
同的检验结果，并使模型比不加约束拟合程度时更差。因此，该模型的自由度 
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为 （I —1 KJ 一 1 )K —2( IK+J — K 一3)。同样，当相等约束被施加到两个维度的 
行得分参数但却没有被施加到另外两个参数时，只有两个而不是 k +1 个跨元交 
互约束是需要的。后一个模型的自由度为 ( I - l )( J - l ) K -2( I + JK - K -3) 0 

接下来位于第三行到第六行的4个模型向我们展示了一些局部同质或不同 
质 RC (2) — L 条件关联模型的另一个有趣特质。模型3仅仅对第二维度（冲和 
v j 2 ) 的行或列数值参数做了平等性约束，但对其他参数 (+ lk 、恤、 Milk 以及 v jlk ) 却 
没有做额外的约束。与预期相反，跨元交互约束并不需要，并且所有的参数都 
是轮流唯一的。事实上，我们只需要在可以不对迭代循环施加跨元交互约束的 
统计软件中使用多个随机初始值，就可以非常容易地确认上述说法。对于那些 
不需要跨元交互约束的模型来说，它们必须都有唯一收敛的最大似然估计和拟 
合优度统计值(详情请见第3章)。同样，当同质相等约束仅仅被施加于第一层 
的行与列得分(叫和冲）而对其他参数 （扣 k 、 扣 k 、 ^^和 v j2k ) 没有做进一步约束 
时，同样的规则也适用于模型4。第五行和第六行中的模型进一步阐释了当我 
们将相等约束扩展到它们相对应的内在关联参数(即扣、抑和％或者扣、 p 和 
v j 2 ) 时，跨元交互约束是不需要的。 

另一方面，第七行到第十行所表示的模型仅需要一个跨元交互约束。它们 
有如下 共性： 比如，在模型7或模型10中，只有条件 2!= iVjiv j2 = 0是必 需的； 

在模型8与模型9中，只有条件=0是必需的。它们正确的自由度 
被列在了第三列中。 

模型11是一个非常有趣的模型，而它已经被笔者 (2001) 详细论述过了。因 
为这个模型在社会科学领域中被广泛地应用 ，所以 下面我将对其做更详细的探 
讨。这个简单的不同质 RC ( M ) 模型假设在所有维度上 ( Fim 和 v jm ) 的行与列得 

分参数都是同质的，但其内在关联参数 4^) 却是不同质的。当 M = 2时，该模 
型可以写成如下 形式： 

log F iik = X + Xf + Xf + Xk + + + ^ ik/^iiVji + ^> 2kjUi2Vj 2 [4. 57] 

该模型的自由度为 （ I —1 )(J —1 )K —2 (I + J + K —4)。 根据笔者 (2001) 的 
论述，这个模型可以被“再参数化”为如下 形式： 



关联模型 


log F ijk = X + Xf + Xf + Xk + X^ c + Xjf 4 - <|>i pm Vji r/ki + 和抑 v 〗2 rjk 2 [4. 58] 

其中， SLitjL = ELi ^ = i 0 当被写成这种形式的时候，该模型与对数三线 

方程非常相似，它们都使用在心理测量文献中非常普遍的标准或类似因子 ( CP ) 

分解方式。我们知道，在一般情况下，由 cp 分解方法得到结果大多是唯一的， 

并且不需要轮转约束 （Carroll & Chang , 1970 ； Harshman , 1970 ； Kruskal ， 

1977)。[1 9 ]其条件对数优比和局部对数优比如下 所示： 

^~^ 2 

log 0jj(k) X J 爪 一 1 士 mk (m Pim ) ( m Vim ) [4. 59] 

及 

log 0ijk 〉: ^ < }hn, k-f-1 ^mk ) ( ^H-l« m ^im ) ( ^~K，m ) [4. 60] 

上述模型可以被视为前面所讨论的对数乘积层效应模型 ( ll 2 ) 与回归类型 
层效应模型 ( LL 3 ) 的一种特殊形式。说它是 ll 2 的特殊形式是因为，尽管它所 
假设的效应更复杂，其层级差异却仍然是对数乘积的比例 （ hk 和扣 k )。 另一方 
面，说它是 LL 3 的特殊形式是因为公式 4. 16中的 xf 5 和咖现在被分别替换为 
(令 lk ， 叫，冲）与(|^， v j 2 )。 不幸的是，在这样的情况下，其条件对数优比的比率 
与其对数优比在不同层级中差异的比率都不再是成比例的了，于是它们只能以 
如下的复杂形式被表现 出来： 

▽ 2 

log 9ij(k) (/li+l，m — pm) ( 叫 1， m — Vj m ) 

•j~~ -— = —1 - L4.61 」 

Og dij(k') 2_j m=1 j>mk' (fJLH-l, m — ) ( V 汗 1， m — Vj m ) 

log 0ij(k) — log 0ij(k,) 2 m=l ( 今 mk — ^1)( M + 1 ， m — pm ) ( Vrfl, m — V) m ) 

log dij(k) — log 0ij(k- ) 2 m=1 ( 4>mk ~ <j>mk m ) (fJiH-1, m — |^m ) ( VH-1, m — Vjm ) 

[4. 62] 

需要注意的是，当受到如同心在公式 4. 57中那样的同质约束的时候， 
上述包含 CP 分解部分的 RC (2) — L 模型与古德曼和豪特所提出的类回归层效 
应模型有着非常相似的结构，并且它被命名为“回归类型 RC 效应模型” 
( Yamaguchi , 1998:241)。 
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在表 4 . 2中列岀的最后两个模型是基于模型11的 CP 设定而提岀的，但它 
们仅有一个而不是两个内在关联参数被施加了相等约束(如 + Ik 或者和 k )。 因为 
两个模型都可以被写成对数三线的项，因此它们不需要跨元交互约束，并且其 
收敛估计是轮流唯一的。模型12和模型13中的条件对数优比与局部对数优比 
的结构与之前列在公式 4. 5 4 与公式 4. 55中的类似，唯一的区别是相等约束的 
不同施加对象，参数 fnk 可以被进一步简化为 f 或和。 

上述对局部同质模型或局部不同质模型的系统性比较可以帮助研究者准 
确定位究竟在哪里需要施加同质性约束或者异质性约束。如果层变量分别或 
同时是时间序列与多个组别，那么对于采用 CP 分解方法的模型（如模型11到 
模型 13) 来说，对参数进行进一步限制是可能的。此外，我们还需要注意的 
是，当条件 RC (2) — L 模型与数据不太契合的时候，我们可以使用混合模型，比 
如 ， U + RC (2)— L、R + RCX 2) — L 、 C + RC (2) —L 以及 R + C + RC (2) — L 。 

在一些情况下，将非参数效应(如平方表中的对角线参数)包括进去是更好的。 
最后，我们也可以考虑另外一种有先验固定数值的模型， U % 1^，…， U ° M ，这实 
际上是对线性相关关联模型的一种推广。模型 U ° M ( m ) — L 或者模型 
(W + K +…+ U ° M ) — L 可以被看做模型 RC ( M ) — L 的一种特殊形式。这与 
豪特(1984、 1988) 提岀的 SAT 模型是类似的，并且它已经被成功地用以探究美 
国职业流动结构的时期变化。 

例 H 教育与职业之间关联的变化 

第一个用来说明的例子是如下 问题: “在美国，教育和职业之间的关系是否 
随时间发生系统性改变，并且这两者之间的关系是否存在性别 差异? ，，表 4. 3中 
展示的列联表频数来自“累积综合社会调查 （1972 —2006 年 ）” （Davis et al . ， 
2007)。 其中包含两个时间段 ：1 975 年至 1 9 80 年以及 1明5 年至 1990 年。个人教 
育是用所获得的学位而不是受教育年限来测量的，这样能够更好地反映出雇主对 
工人证书的需求。受教育程度因此被分为4个等级:（1)四年制大学或 以上; （2) 两 
年制社区 大学； （3) 高中； （ 4 )高中以下。个人职业被分为5类：（1)高级非体力 
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( UMN )； ⑵低级非体力 ( LNM ) ;⑶高级体力 （ UM ) ; (4) 低级体力 ( LM ) ; (5) 农业 
( F )。 样本只取年龄介于25岁到39岁之间的白人男性与白人女性。下面的分析 
因此便基于一个4 X 5 X 2 X 2的表格(表 4. 3) ，样本总量为4078。 


表 4. 3美国白人教育与职业之间关联的时期变化 （1975 — 1990年) 


教育文凭 





职 

业 





UNM 

LNM UM 

LM 

F 

UNM 

LNM UM 

LM 

F 

(1) 1975— 1980年 



白人男性 




白人女性 



四年制大学或以上 

201 

29 

8 

13 

5 

152 

29 

2 

8 

0 

两年制大学 

18 

6 

3 

6 

0 

17 

12 

0 

3 

0 

高中 

109 

74 

164 

89 

16 

101 

336 

9 

134 

2 

高中以下 

7 

6 

45 

30 

6 

7 

41 

7 

63 

0 

(2) 1985—1990年 



白人男性 




白人女性 



四年制大学或以上 

247 

58 

20 

23 

2 

288 

51 

1 

17 

3 

两年制大学 

48 

11 

16 

13 

1 

47 

38 

2 

18 

0 

高中 

157 

68 

178 

116 

27 

165 

321 

27 

168 

1 

高中以下 

7 

7 

50 

42 

5 

12 

25 

5 

29 

6 


仔细观察表格，我们可以发现，随着美国经济快速地由工业向后工业、服务 
型经济转型，现在较多的工人处于非体力职位，而较少的工人处于体力与农业 
职位。对于女性来说，情况更是这样。同时，尽管在最后一列(农业)的几个单元 
格中只有很少或者根本没有个案，但让人放心的是，它们对所估计的关联参数 
的影响可以忽略不计。这就证实了之前的说 法:“ 单元格中没有个案或者只有 
很少的个案，对于关联参数来说没有太大的影响，因为后者是由整行或者整列 
而不是个别单元格得来的。” 

表 4. 4报告了一系列同质和不同质的关联模型，从而探究了教育与职业之 
间的关联是如何随时间并在不同性别中发生变化的。第一个模型是基准模型， 
它假设存在常数关联。该模型也可被称为“ RC (0)- L ” 模型，其自由度为48且 
L 2 为1371，这就清楚地说明，表格中存在恒定关联并不是一个合理的假定。第 
二行和第三行分别报告了由同质与非同质的 RC (1) — L 模型所得到的结果。 
尽管同质 RC (1) — L 模型较之基准模型，有了极大的进步，但其拟合值仍然表 
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明，该模型与数据的拟合情况并不好。而就不同质 RC (1) — L 模型而言，尽管还 
是不能符合一般的标准，但它也有巨大的改进(2 4 个自由度且 L 2 为69)。同质 
模型的 BIC 值 (一 205) 比起不同质模型的 BIC 值（一130)，其负值更大。尽管许 
多人因此会选择同质模型为最终的模型，但这却不一定是一个好的决定，因为 
其他的竞争性模型也许能给出一个同样的甚至负值更大的 BIC 值。 

表 4.4 应用于表 4.3 的一般 RC ( M ) — L 关联的结果 

由度 


1. RC (0) —L (同质） 

48 

1370. 93 

971. 89 

23.75 

0. 000 

2. RC (1) —L (同质） 

42 

143. 83 

一 205. 33 

6. 39 

0. 000 

3. RC (1) — L (不同质） 

24 

69. 06 

-130. 46 

3. 04 

0. 000 

4. RC (2 )—L (同质) 

38 

117. 38 

-198. 52 

5. 24 

0. 000 

5. RC (2) — L (不同质） 

8 

5.83 

-60. 67 

0. 44 

0. 666 

6. RC (3) — L (同质) 

36 

113. 18 

一 186. 10 

5. 19 

0. 000 

7. RC (3) —L (不同质） 

0 

0. 00 




8. U + RC (同质） 

41 

124. 75 

一 216. 10 

5. 58 

0. 000 

9. U+RC (不同质） 

22 

27. 47 

-155. 42 

1. 50 

0. 194 


接下来的两组模型(第四行到第七行)将关联维度由1增加到2或者3。其 
中，异质二元关联模型(第五行）给岀了目前为止最好的结果 （8 个自由度且 L 2 
为 6) 。比较同质 RC (2) — L 模型与不同质 RC ⑵ 一 L 模型我们可知，30个自由度 
的差异带来了 111. 6个卡方值的变化，这清楚地表明，教育与职业之间的关联在表 
中是不相同的。当不同质 RC (3) 模型是一个自由度为0的饱和模型时，与它相对 
应的同质模型有36个自由度且 L 2 为113。最后两个模型(第八行与第九行)是混 
合模型，它们使用了一个有细微差别的表达式 （U + RC ) ，从而捕捉到复杂的关联 
结构。不同质 U+RC 模型的拟合值也得到了非常好的结果 (20 个自由度， L 2 为 
2?且 p 为 0. 12)。同质模型与不同质模型的对比也显示岀表中的显著差异(在16 
个自由度的情况下改变了将近 97 个卡方值)。虽然我们可以使用其他的混合表 
达式，如 R + RC 、 C + RC 以及 R + C + RC 来更好地理解相关关系，但下面的讨 
论将仅仅使用 RC (2) — L 模型来展示跨元交互约束可以在什么情况下被放松或 
缩小，以及如何在需要的时候正确计算自由度。[ 2 0] 


BIC A 


模型描述 



关联模型 


使用列在表 4. 4中的模型，我们可以分解它们的拟合值，从而确定那些能够 
帮助我们理解相关关系的确切的关联维度。两个划分的结果在表 4 . 5中显示出 
来。在组 (1) 中，划分是基于不同的完全同质模型。比如，模型1与模型2的比 
较表明，教育与职业之间绝大多数的关联都存在于第一个维度（ 89 . 5%，6个自 
由度），到了第二维度与第三维度，因为对数乘积部分的不同质，关联便分别仅 
有2%与0.3%。基于完全异质模型的类似结果也可以在组 (2) 中被找到。绝大 
多数的关联都存在于第一维度(95%)，模型3与模型5的比较表明，第二维度仅 
带来略微多于 4. 6%的变异，而第三维度则只有不到 0. 5%。换句话说，两组结 
果都表明，表达式 RC (2) — L 最好地捕捉到了教育与职业之间的总关联，且表与 
表之间存在巨大差异。 


表 4. 5对应用于表 4. 4的 RC ( M ) — L 模型的关联进行分析 


来 源 

所使用的模型 

L 2 部分 

占总体百分比 

自由度 

(1) 基于完全同质模型的部分 




第一维度 

(1)-(2) 

1227. 10 

89. 50 

6 

第二维度 

(2)-(4) 

26. 45 

1. 93 

4 

第三维度 

(4)-(6) 

4. 20 

0. 31 

2 

不同质 

(6) 

113. 18 

8. 26 

36 

总计 

(1) 

1370. 93 

100. 00 

48 

(2) 基于完全不同质模型的部分 




第一维度 

(1)-(3) 

1301. 87 

94. 96 

24 

第二维度 

(3)-(5) 

63. 23 

4. 61 

16 

第三维度 

(5)-(7) 

5. 83 

0. 43 

8 

总计 

(1) 

1370. 93 

100. 00 

48 


从不同质 RC (2) 模型开始，表 4. 6报告了一系列受到部分同质约束的模 
型。在有 6 组参数、 和 k 、 ptilk 、 Pi2k 、 Vjik 和 Vj2k) 供考虑的情况下，我们需要采 
取一个正确且系统性的策略。采取常规的方法对同质平等性约束的检验首先 
被应用于行与/或列的得分参数。如果结果显示支持，对内在关联参数的进一 
步同质相等约束就会被加入。如果使用得当，这个策略就可以得岀简单却非常 
便于理解的结果。需要注意的是，也许并不是所有在表 4. 6中报告的模型都是 
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必要的，它们被包括在这里仅仅是为了证明之前所讨论的 观点： 它们中的一些 
只需要更少，甚至不需要跨元交互约束。 


表 4. 6部分同质或部分不同质 RC (2) — L 模型 


模型描述 

自由度 

L 2 

BIC 

△ 

P 

1. 同质的 flil 与~ 

20 

29. 25 

-137. 02 

1. 82 

0. 083 

2. 同质的 v n 与 v i2 

14 

7. 98 

— 108.42 

0. 69 

0.891 

3. 同质的押与 Vjl 

15 

11.21 

-113.49 

0. 89 

0. 737 

4. 同质的抑与 v j2 

15 

16. 90 

-107. 80 

1. 46 

0.325 

5. 同质的抑、叫与 

22 

19. 61 

一 163. 28 

1. 23 

0. 608 

6. 同质的押、与 v j2 

25 

33. 01 

-174. 82 

2. 10 

0. 130 

7. 同质的 f、 邱与 vu 

18 

12. 35 

-137.29 

1. 00 

0. 829 

8. 同质的扣、抑与啡 

18 

18.21 

~ ■131. 43 

1. 24 

0. 442 

9. 同质的押、抑、叫与 v i2 

30 

38. 46 

-210. 94 

2. 12 

0. 138 

10. 同质的 /Ltil 、 /Xi2 、 Vjl 与 Vj2 
且约束 f (性别效应随 
时间保‘恒定） 

32 

40. 44 

— 225. 59 

2. 17 

0. 146 

11. 同质的和、 JLtil 、抑、 Vjl 
与 Vj2 

33 

43. 44 

-230. 90 

2. 31 

0. 106 

12. 同质的扣、押、岬、 v n 
与 V j2 且约束 扣 （对不同 
时期的女性相等） 

34 

44. 64 

— 238. 01 

2. 70 

0. 105 

13. 同质的扣、扣、卯、岬、 

Vjl 与 Vj2 

38 

117.38 

— 198.52 

5. 24 

0. 000 


前4个模型提供了不同组合以检验两个维度的行与列数值在不同性别组与 
不同时期是相等的(层变量是一个 2 X 2 的类别变量)。每个模型都表示不同的 
检验 :模型 1在两个维度上都取相同的行 得分; 模型2在两个维度上都取相同的 
列 得分; 模型3在第一维度上取相同的行与列 得分; 最后，模型4在第二维度上 
取相同的行与列得分。除了第一个模型，行与列得分在两个维度上确实是在不 
同层级上相等的。比如，在两个维度上有相同列得分的模型有14个自由度且 
L 2 为8,这表明，只有非常少的经验证据能够否定“行得分参数在不同层级上相 
等”这个虚无假设。根据表 4. 2,模型1与模型2需要两个跨元交互约束，而模 



型 3 与模型4则不需要这样的约束。 

接下来的两个模型试图检验3项中的相等约束 ：模型 5(~、 p 和和 
模型6(叫 、冲和 v j 2 )。 两个模型都只需要一个跨元交互约束。根据它们的拟 
合值，这样的约束似乎对于前者 （22 个自由度且 L 2 为 20) 比对于后者 （25 个 
自由度且 L 2 为 33) 更加合适。模型7假设在第一维度中的所有参数 （和、 ~ 
和仲）都是同质的，而模型8假设在第二维度中所有参数（和、 ] ^和 吨）都是 
同质的。这两种情况都不需要跨元交互约束，并且它们的结果都是令人满意 
的(在18个自由度下, L 2 分别为12和18)。模型9则采用了 CP 分解的方法 
并假设两个内在关联参数和是不同质的。这个模型的拟合值一般 （30 
个自由度且 L 2 为38)。与所有到目前为止被讨论过的模型相比，模型9因为 
其在所有 RC ( M ) 模型中 BIC 值负值最多而被偏好。此外，比较现在的模型与 
它们的完全同质与完全不同质部分(表 4. 4中的模型4与模型5)，我们可以 
得知， 111. 6卡方中的 78. 9,或者说有 70. 7%的总变化都可以被8个内在参 
数 （+ lk 和 < f >2 k ) 解释，而行与列得分 ( jUilk 、/ li 2 k 、 Vjlk 和 Vj 2 k ) 在不同层级中的变化则 
可以解释剩下的 29. 3%。 

在模型9的基础上，最后4个模型希望对两个维度上的内在关联参数再加 
进一步的约束。通过对的仔细观察，我们可知，在第一维度，性别随时间只有 
很少，甚至没有变化，模型10检验了这个假设。与之前的模型相比，两个增加的 
自由度并没有导致拟合程度任何明显的退步。进一步观察发现，对于第一维度 
中的男性与女性而言，内在关联参数也没有发生变化。这个假设在模型11中得 
到检验，而后一个模型的相对拟合程度是令人满意的。基于这个模型的估计， 
当女性在第二维度的内在关联参数保持不变时，那些男性的参数却变化了。模 
型12检验了但无法拒绝这个包含特殊约束的假设。 

最后，表 4. 4 中的模型 13 再一次报告了完全同质的 RC (2) 模型。在这里， 
我们可以看到，和扣 k 受约束的变化为我们提供了一个最简洁明了的方式来 
理解美国教育与职业的关联是如何在不同时期与不同性别组中变化的。使用 
如和 恤中的 4 个参数，被偏好的模型（模型 12) 可以捕捉到总变化中的 65%。 
此外，受到偏好的模型不仅符合一般标准，而且它所提供的 BIC 值负值最大。 
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换句话说，当存在可选择的竞争性假设的时候，我们不得不在模型的精确性与 
科学的简洁性上做交换的说法并不成立。 

表 4. 7报告了模型9与模型12的参数估计值与渐进标准误(通过 R 中的 

模块实现)。正如预期的那样，两个模型中的估计行得分参数与列得分参 
数高度相关，并且模式类似。经过对模型9的参数估计值进行对称标准化(公式 
2. 38)，图 2. 2与图 2. 3向我们提供了估计行得分(教育)与估计列得分(职业)各 
自的图像表现形式。就教育而言，非常明显的是，其第一维度是垂直的（比如， 
更高的教育程度有着更高的得分），而第二维度则表示对该垂直图像的偏离。 
与之类似，在第一维度的估计列得分(职业)符合一般的社会经济地位排 序:非 
体力职业的排序比体力职业与农业职业靠前。唯一复杂的地方是，低级体力职 
业有着比农业职业与高级体力职业更高的排序。然而，这种差异在第一维度中 
是很小的。相反，大部分的差异都表现在第二维度的体力与农业职业之间。这 
种异常也许在一定程度上是由样本限制造成的，因为我们的分析只包括那些尚 
处于他们职业生涯早期和中期的个体(年龄介于25岁到39岁之间）。然而，第 
一维度的行与列得分已经反映出了社会经济等级可能是地位获得的垂直图像， 
即一个人的教育程度越高，其社会经济地位就越高。 


表 4. 7教育与职业之间的关联随时间变化的参数估计 (1975 — 1990年) 



参 数 

模型 9 

模型 12 

第一维度 

第二维度 

第一维度 

第二维度 

^>mk 

男性 (1975 —1980年） 

3. 075 

0. 539 

2. 979 

0. 731 



(0. 399) 

(0. 443) 

(0.336) 

(0. 467) 


女性 （1975 —1980年） 

3. 474 

1 . 686 

2.979 

1. 973 



(0. 537) 

(1. 124) 

(0. 336) 

(0. 972) 


男性 （1985 —1990年） 

2. 949 

—0. 770 

2. 979 

_ 0 . 705 



(0.411) 

(0. 484) 

(0. 336) 

(0. 421) 


女性 （1985 —1990年） 

2. 460 

1. 892 

2. 979 

1. 973 



(0. 382) 

(1. 110) 

(0. 336) 

(0. 972) 

f^im 

四年制大学或以上 

-0. 640 

0. 731 

_ 0. 650 

0. 770 



(0. 029) 

(0. 079) 

(0. 027) 

(0. 060) 



关联模型 


(续表) 


参 数 

模型9 

模型12 

第一维度 

第二维度 

第一维度 

第二维度 

两年制大学 

— 0. 239 

-0. 217 

—0. 227 

一 0 . 165 


(0. 039) 

(0.141) 

(0. 039) 

(0. 143) 

高中 

0. 168 

一 0. 636 

0. 171 

-0. 617 


(0.031) 

(0. 083) 

(0. 028) 

(0. 083) 

高中以下 

0.711 

0. 121 

0. 705 

0. 012 


(0. 021) 

(0. 171) 

(0. 019) 

(0. 167) 

V jm 高级非体力 

_ 0 . 765 

0.071 

-0. 748 

0. 043 


(0. 025) 

(0. 101) 

(0. 030) 

(0. 077) 

低级非体力 

_ 0. 250 

—0. 480 

— 0 . 280 

-0. 477 


(0. 046) 

(0. 073) 

(0. 050) 

(0. 073) 

高级体力 

0. 398 

-0. 198 

0. 393 

-0. 227 


(0. 052) 

(0. 105) 

(0. 053) 

(0.102) 

低级体力 

0. 273 

-0. 216 

0. 259 

一 0. 169 


(0. 048) 

(0. 066) 

(0. 047) 

(0. 063) 

农业 

0. 344 

0. 824 

0. 376 

0. 831 


(0. 086) 

(0. 039) 

(0. 086) 

(0. 031) 


注: 括号中的值为渐进标准误。 


根据模型12,第一维度的内在关联参数并不存在性别差异与时间变 
化。[ 21 ]所有的性别与时间差异都存在于第二维度。如果第一维度表示社会 
经济等级，那么，第二维度就可以被理解成该等级的额外渠道或者障碍。鉴于 
内在关联参数对于美国妇女来说 （扣 = 1. 973)，在两个时期都非常显著及稳 
定，那么，这些额外的渠道或者阻碍在各个时期也是一样的。也许最有意思的 
是，虽然在程度上比女性弱，但这些渠道和限制在1975年到1980年间对于美 
国男性来说也是存在的，不过它们的效应到了 1985年到1990年就变成了逆 
向的。 

那么，这些额外的渠道和/或者阻碍究竟是什么呢？首先，在其他条件 
都一样的情况下，受教育程度为“两年制大学”与“高中”的个人更可能从事 
非体力的职业（在第二维度上的行与列得分都是正的）。这个发现与非体力 
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劳动力的女性化趋势是一致的。与其他发达的工业社会一样，这种现象在 
职员类、秘书类以及销售类职业中尤其明显。第二，有比我们所想象的多得 
多的大学毕业生在农业部门工作。当然，这并不必然代表一个显著的发展 
趋势，因为所涉及的两个性别的实际人数都非常少。第三，大学毕业生相对 
来说，不太可能在低级非体力与体力职业中绝迹。这也许反映了许多非体 
力职位职业化的一般趋势。尽管这些额外渠道以及阻碍的来源由受个人偏 
好影响的劳动力市场的需求与供给所决定，但它们仍然表现出非常明显的 
性别社会分工。 


例 4. 2:教育水平和婚前性行为态度的关系 


第二个例子检验了美国教育水平和婚前性行为的关系中可能出现的时间 
变化情况。表 4. 8的信息来自1972年至2006年的累计综合社会调查数据 ( Da - 
vis et al . , 2007) ，并且只包括女性。这里总共有21个表格及16548个样本。教 
育水平分为4个类别： （1) 高中 以下； （2) 高中； （3) 大专; （4) 大学及以上。婚前性 
行为态度则同样分4种情况：（1)总是错 误的； （2) 几乎总是 错的； （3) 有时是错 
的；（ 4 )没有错。因此，以下的分析是关于一个 4 X 4 X 21 的表格。这里起作用的 
假设是，如果存在一种释放个人自由的环境，且允许女性对她们身体拥有更大 
控制权，而且具有更高教育水平的女性更可能支持这种观点的长期趋势，那么， 
(低)教育水平和(不同意)婚前性行为之间的强关联应该随着时间变化而下降。 

表 4. 8女性群体中教育水平和婚前性行为态度的交互表 


教育水平 


高中以下 

高中 

大专 

大学及以上 


婚前性行为态度 




1974年 



1975 ^ 


4 


170 

29 

59 

50 

129 

32 

105 

46 

76 

50 

88 

48 

43 

9 

27 

28 

38 

11 

13 

9 

23 

21 

20 

13 


46 

33 

124 

42 

63 

60 

85 

91 

99 

42 

58 

85 

35 

38 

32 

15 

30 

45 

25 

34 

17 

12 

38 

23 
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教育水平 

婚前性行为态度 

123412341234 


1977年 1978年 1982年 


高中以下 

139 

28 

65 

59 

125 

31 

41 

91 

164 

37 

58 

91 

高中 

98 

32 

68 

106 

106 

38 

78 

103 

112 

30 

82 

135 

大专 

33 

15 

36 

40 

45 

18 

32 

61 

49 

17 

41 

94 

大学及以上 

28 

10 

12 

37 

17 

13 

27 

40 

25 

16 

26 

63 



1983年 



1985年 



1986年 


高中以下 

105 

27 

38 

76 

102 

19 

29 

70 

100 

26 

40 

70 

高中 

96 

43 

91 

98 

103 

28 

61 

99 

98 

33 

74 

94 

大专 

38 

18 

47 

64 

43 

14 

46 

88 

44 

5 

44 

61 

大学及以上 

38 

14 

37 

59 

27 

8 

21 

57 

30 

8 

31 

58 



1988年 



1989年 



1990年 


高中以下 

66 

19 

25 

37 

59 

12 

23 

42 

43 

14 

20 

30 

高中 

40 

22 

43 

63 

75 

19 

38 

63 

47 

21 

35 

65 

大专 

25 

17 

30 

52 

23 

17 

35 

59 

31 

18 

30 

44 

大学及以上 

20 

9 

29 

35 

21 

5 

26 

37 

25 

12 

23 

42 



1991 年 



1993年 



1994年 


高中以下 

64 

14 

21 

43 

47 

17 

20 

33 

88 

21 

32 

61 

高中 

47 

29 

38 

71 

59 

20 

45 

74 

117 

39 

69 

136 

大专 

39 

12 

25 

61 

34 

19 

28 

66 

78 

35 

54 

115 

大学及以上 

26 

15 

27 

48 

29 

10 

31 

51 

65 

23 

71 

120 



1996年 



1998年 



2000年 


高中以下 

68 

21 

31 

66 

60 

23 

35 

45 

70 

18 

29 

67 

高中 

97 

35 

72 

120 

103 

28 

73 

110 

96 

29 

65 

107 

大专 

61 

46 

66 

122 

78 

31 

55 

115 

79 

26 

72 

122 

大学及以上 

58 

21 

68 

110 

59 

26 

58 

113 

62 

21 

54 

96 



2002年 



2004年 



2006年 


高中以下 

36 

7 

10 

20 

25 

7 

3 

20 

57 

18 

33 

54 

高中 

57 

14 

34 

59 

54 

12 

22 

46 

90 

23 

61 

105 

大专 

40 

15 

25 

64 

48 

16 

33 

63 

107 

30 

60 

146 

大学及以上 

29 

9 

24 

52 

21 

11 

29 

56 

71 

25 

70 

36 


注 :样本 总量为16548。 
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表 4. 9呈现了一系列模型，用以考察随着时间变化而可能岀现的变化。条 
件独立模型(第一行)是用以比较的基准模型。它具有189个自由度且 L 2 等于 
651。在这样的形式下，有接近8%的女性被错误地分类。另一方面，完全二元 
交互或者同质关联模型有了更大的改善 （180 个自由度且 L 2 等于193)，但其拟 
合优度统计值则下降了 70%。当我们尝试选择同质关联模型作为合理的近似 
方法时，应该再一次明确地检查其他检验时间变化的模型。两个层效应 LU 和 
LU 在第三行和第四行中被估计和报告岀来。它们的结果非常相似，尽管对数 
乘积设定表现更佳。然而，尽管 LU 和 LL 2 具有20个自由度且其 AL 2 分别为 
19和22,但是仍然缺乏证据证明(非结构化)优比存在时间变化。同时，检验变 
化失败的部分原因是检验本身缺乏统计解释力。相反，我们应该使用更具解释 
力的1自由度参数检验法来考察可见的趋势。当添加了线性趋势约束(第五行) 
时，它仅仅优于同质关联模型。假设它们的 BIC 统计值几乎相同，我们反而应 
该首选没有添加约束的模型 ( Raftery ， 1996； Wong , 1994)。换言之，在1个自 
由度下，显著的卡方统计值 5. 25可能仅仅是大样本的结果。 


表 4. 9适用于 4. 8的关联模型结果 


模型描述 

自由度 

L 2 

BIC 

A 

P 

1. 条件独立 

189 

650. 81 

-1185. 14 

7. 84 

0. 000 

2. 同质关联 

180 

193. 07 

-1550. 45 

3. 92 

0. 169 

3. 对数线性层效应 (LU) 

160 

174. 04 

— 1380. 21 

3. 64 

0.212 

4. 对数乘积层效应 (LL 2 ) 

160 

170. 83 

-1383.41 

3. 59 

0. 265 

5. 带有线性趋势约束的模 
型4 

179 

187. 82 

-1550. 99 

3. 82 

0. 311 

6. 异质 U 

168 

232. 60 

-1399. 35 

4. 39 

0.001 

7. 异质 RC 

84 

94. 45 

-721. 53 

2. 48 

0. 204 

8. 简单异质 RC 

164 

178. 42 

-1414. 68 

3. 75 

0. 209 

9.在 N 中带有线性趋势约 
束的模型8 

183 

195. 46 

-1582.20 

3. 95 

0. 251 

10. 在 N 中带有二次趋势约 
束的模型8 

182 

195. 36 

-1572. 59 

3. 96 

0.236 

11. 同质 RC 

184 

206. 45 

— 1580. 93 

4. 08 

0. 123 
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(续表) 


模型描述 

自由度 

L 2 

BIC 

A 

P 

12. 模型 8 + V3 = V4 

165 

179. 55 

-1423.27 

3. 79 

0. 208 

13. 在+中带有线性趋势约 
束的模型12 

184 

196. 79 

一 1590. 59 

3. 96 

0. 246 


在上表中，我们估计了两个特别的关联模型，用以捕捉教育水平和婚前性行 
为态度之间的关系。第一个模型是异质单一性关联模型(第六行)，而第二个模型 
则为异质对数乘积行与列效应模型(第七行)。从第二个模型中得到的结果明显令 
人满意（自由度为84, L 2 等于 94. 5,且 P 为 0. 2) ，但是第一个模型则表现一般 (168 
个自由度， L 2 等于233)。表中的其他模型在 RC (1) 模型中加入了各种约束来考察 
变化趋势。在行与列数值参数 ( p 和 M 上，第八行中的简单异质模型等同于偏同 
质 RC 模型，它们只通过和来捕捉时间趋势。这一模型的总体拟合程度是令人满 
意的 (164 个自由度， L 2 等于 178. 4)。从两个线性趋势(第九行)和二次方趋势(第 
十行)约束中得到的结果事实上是等同的，这表明，第二种设定明显与数据不一致。 

从第十一行中的同质 RC 模型中，我们可以确定过去34年中的内在关联的 
变化幅度。对比模型8和模型11可以看到，如的方差总和大概等于20个自由 
度下的28个卡方值。仅具有1个自由度的线性趋势约束大约可以占据17个卡 
方值，或者大约61%的方差。而且，模型9和模型11之间的嵌套卡方差异检验 
在 0. 001水平上是统计显著的，这明确地拒绝了关于线性趋势是由随机噪声或 
者误差导致的这一假设。我们从模型10中得到的 BIC 统计值是目前为止最大 
的负值(一 1582)，所以这个模型明显优于其他更简单但很可能是错误的模型。 

或许我们可以得到更精简的模型。对模型8的参数估计值的进一步考察表 
明，关于婚前性行为态度的列估计值十分接近“有时是错的”和“没有错”这两个类 
别(如 w = v 4 )。 当仅仅添加这一约束(第十二行)和同时添加这一约束与线性趋 
势约束(第十三行)时，它们均生成了令人满意的结果，而且应该是优先选择的。总 
而言之，模型9和模型13都可以用以理解教育水平和婚前性行为态度之间的关联 
程度随时间而产生的微妙变化。一些实证研究者可能过于强调或滥用了在模型 
准确度和科学精简度之间作出妥协的例子，因为这两个目标是可能同时达成的。 
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表 4. 10「 22 ]展示了从模型9和模型13中得到的参数估计值与它们的渐进 
标准误。除了 v 3 和 v 4 之外，两个模型报告的参数估计值之间并不存在差异。 
一般而言，教育水平更低的女性对待婚前性行为的态度更加保守，但不赞成它 
“总是错的”。然而，大学教育水平的女性更可能容忍或者原谅这类行为，她们 
倾向于将婚前性行为看做“有时是错的”或者“并没有错”。换言之，这里的结果 
证实了在教育水平和婚前性行为态度之间存在着强关系。然而，这种关系并不 
是静止的，并且它的强度在1972年至2006年之间经历着微妙但缓慢的下降(见 
图 4. 1)。 


表 4. 10美国女性的教育水平和婚前性行为态度 
随时间变化的关联程度参数估计值 (1972 —2006年) 


参 数 

模型9 

模型13 

f (基准模型） 

0.812 

0. 811 


(0. 068) 

(0. 066) 

f 的线性趋势 

—0. 010 

— 0. 010 


(0. 003) 

(0. 003) 

Mi 高中以下 

-0. 769 

-0. 771 


(0. 017) 

(0.017) 

高中 

— 0. 086 

一 0. 082 


(0. 035) 

(0. 035) 

大专 

0. 296 

0. 292 


(0. 041) 

(0. 042) 

大学及以上 

0. 560 

0. 561 


(0. 035) 

(0. 035) 

V, 总是错的 

—0. 771 

-0. 771 


(0. 028) 

(0. 028) 

几乎总是错的 

-0. 111 

一 0. 115 


(0. 061) 

(0. 061) 

有时是错的 

0. 398 

0. 443 


(0. 043) 

(0.016) 

没有错 

0. 484 

0. 443 


(0. 038) 

(0.016) 


注:括 号内的数值为渐进标准误。 


1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 

年份 

Q 观测值 预^ 

图 4.1 教育水平和婚前性行为之间随时间变化的关联情况 

当内在关联程度的年均下降幅度相对较小 (0. 010) 时，其超过40%的累积下 
降幅度(从 0. 812至 0. 482) 则是影响重大的。然而，如果没有使用这些统计上有力 
的检验方法，我们可能无法观测到这些微妙的变化。总而言之，各种条件关联模型 
的实用性在这两个例子中已经成功地被证实了。在这两种情况下，最终的模型可 
以提供简单且具有实质解释力的结果。意义更重大的是，我们对最终模型的选择 
满足了两个看似矛盾的要求——模型准确度和科学精简度。 





第 5 章 I 关联模型的实际应用 



关联模型的应用已经在前几章中成功地用来分析双向表 、三 向表甚至多向 
表。它们不仅对复杂的关联模式提供了深人的理解，其结果还揭示了当关联模 
型与数据一致时，将传统的数据检验作为选择竞争模式的准则仍然是有重大意 
义的。此外，对最终首选模式的选择看起来并不受样本量的影响，尽管后者在 
不同的例子中从少于1000到多于16000之间的差别非常大。另一方面，只有当 
具体的某个模型“错误”时，样本量的影响才会显示岀有问题。换句话说，大部 
分对于样本量影响的探讨是建立在错误的或者不准确的模型分类基础上的 
(Wong，2003a)。 在这种情况下，任何“正确”模型中的微小偏离都会被大规模 
的样本量放大。如果没有认真考虑可供选择的竞争模型，任何对常用模型选择 

标准不加以区分地使用，如 BIC 统计值，都非常可能导致接受“错误，，的模型 
(Weakliem, 1999)。 


为了能够进一步解释关联模型的潜在使用价值，本章将提供两种应用的方 
式。第一种是要解决行变量和/或者列变量的某些类别是否可以合并的问题。 
这个重要的问题已经被古德曼 (1981c) 详细地解释了，但是现在的讨论已经扩大 
到包括 RC(M) 关联模型来为同一个主题提供另外的见解。接下来的发现进一 
步揭示出研究者需要密切关注聚集性问题的另一面，并且要求研究者认真考虑 
与不正确聚集的后果相关的潜在问题。当应用不正确时，研究者可能会不自觉 
地曲解基本的关联模式 (Wong，200 3 b)。 第二种阐述了把 RC 关联模型作为最 
佳量度工具的潜在使用价值（相关讨论见 Rosmalen, Koning & Groenen, 
2009)。相似的主题已经在 RC 关联模型使用之前在双向表中阐述过了 (Kateri & 
Iliopoulos， 2004； Smith & Gamier, 1987)。通过偏对数乘积关联模型，现在这 
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个主题已经扩展到三向表(并且可能是高阶表格），从而在方法和理论上获得了 
更加可信和有效的水平。“合理”水平的建立可以被用在接下来的多元变量分 
析中。 


例 5.1: 决定某些类别是否可以合并的关联模型 

I 

第一个例子(表 5. 1) 来自格特曼 ( Guttman ，1971) ，这张表交互展示了 1554 
个成年以色列人的“主要忧虑”和他们的生存环境。在一些案例中，显示的是他 
们父亲的情况。这个案例已经通过对应分析的方法进行了相当深入的分析 
( Greenacre , 1988)。行变量测量个体的主要忧虑 （ WOR ) 并且总结岀了 8 点: 
(1) 政治环境 ( POL ) ; (2) 军事环境 ( MIL ) ; (3) 经济环境 （ ECO ) ; (4) 应征入伍亲 
属 ( ENR ) ; (5) 阴谋破坏 ( SAB ) ; (6) 多重忧虑 ( MTO ) ; (7) 个人经济状况 ( PER ) ; 
(8) 其他忧虑 ( OTH )。 列变量测量个体的生存环境并且总结岀5点：（1)住在欧 

4 

洲或美国 (EU AM ); (2) 住在以色列，父亲住在欧洲或美国 （ IFEA ); (3) 住在亚 
洲或非洲 ( ASAF ) ; (4) 住在以色列，父亲住在亚洲或非洲 （ IFAA ) ; (5) 住在以色 
列，父亲也住在以色列 ( IFI ) 。 


表 5.1 成年以色列人的主要忧虑和生存环境 


主要忧虑 


生存环境 


EUAM 

IFEA 

ASAF 

IFAA 

IFI 

政治环境 (POL) 

118 

28 

32 

6 

7 

军事环境 (MIL) 

218 

28 

97 

12 

14 

经济环境 (ECO) 

11 

2 

4 

1 

1 

应征入伍亲属 (ENR) 

104 

22 

61 

8 

5 

阴谋破坏 (SAB) 

117 

24 

70 

9 

7 

多重忧虑 (MTO) 

42 

6 

20 

2 

0 

个人经济状况 (PER) 

48 

16 

104 

14 

9 

其他忧虑 (OTH) 

128 

52 

81 

14 

12 


注 :样本 总数为 1554。 

资料来源: Guttman ， 1971。 
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拜表 ft 据分析 


为了符合分析，我们常用标准相关和古德曼的 RC ( M ) 关联模型来分析表 
格 ( Gilula ， 1986； Gilula & Haberman , 1988)。因为关联模型、对应分析和标 
准相关有着密切关系 （ Goodman ， 1985； Greenacre , 1984) ，所以这3种类型的 
分析差异不是很大。我们潜在的目标是弄清楚某些行类别和/或者列类别是 
否可以合并，从而得到对这些基本关联情况更简单的理解。换句话说，我们感 
兴趣的是探究一些行和/或者列是否具有相似的倾向。当然，行类别和/或者 
列类别是否可以合并以及哪个行类别和/或者列类别可以合并是一个经验上 
的问题，尤其是当这些类别在现有的例子中无法轻易地形成简单有序的排 
列时。 

表 5. 2( a ) 提供了一系列的统计模型用来理解主要忧虑与生存环境的关联。 
自变量模型有28个自由度， 121. 5的 L 2 , 还有近10%的个案被错误地分配在模 
型里。另一方面，第一维度的 RC 关联模型 RC (1) 提供了一个巨大的进步。这 
个模型有18个自由度， 29. 2的 L 2 , 这表明，似然比卡方统计值大约减少了 76% 
并且仅仅在 0. 05的水平上显著。因为这个模型在统计上可被接受，所以读者可 
以尝试在行与列数值上添加平等性约束，从而获得更加精简的结果，虽然存在 
统计不显著的情况。 

这可以从第三行和第四行的模型中获得。第三个模型在估计行数值上加 
入了以下平等性 约束： MIL = ECO = MTO 和 ENR = SAR = OTH ， 并且在估 
计行数值上加入了以下平等性 约束 : ASAF = IFAA ， 同时，第四个模型加入了 
一个进一步的约束，使以上的所有行数值都相等（如 MIL = ECO = MTO = 
ENR =SAR = OTH )。 相对于模型2,模型 3 获得的5个自由度并没有导致拟 
合优度统计值的任何显著下降。然而，所有6个行数值的进一步平等性约束可 
以被否定 (1 个自由度， L 2 等于 4. 9)。当其他一切都保持一致时，第三个模型似 
乎是一个完美的模型，因为它在统计上并不显著 ( p 为 0. 16) ，并且拥有大量的负 
BIC 统计值。但是，这样的结论可能站不住脚。 

第五个模型将对数乘积 RC 模型的维度增加到2个，结果令人满意 （10 个 
自由度， L 2 为 6. 8, p 为 0. 74) 0 
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表 5. 2主要忧虑的分析例子 


模型描述 

(a) 初始表格 

df 

L 2 

BIC 


A 

P 

1. 独立模型 

28 

121. 47 

-84. 29 


9. 84 

0. 000 

2. RCC1) 模型 

18 

29. 19 

_ 103. 08 


4.01 

0. 046 

3. 带有平等性约束 MIL = ECO = 







MTO, ENR = SAB = OTH 和 
ASAF= IFAA 的 RC(1) 模型 

23 

29.61 

-139.41 


4. 08 

0. 161 

4. 带有平等性约束 MIL = ECO = 







MTO = ENR = SAB = OTH 和 

24 

34. 51 

-141.85 


4. 80 

0. 076 

ASAF= IFAA 的 RC(1) 模型 







5. RC(2) 模型 

10 

6. 81 

-66. 68 


0. 87 

0. 743 

6. 在两个维度上均带有平等性约 







束 ECO = MTO = MIL = ENR 
=SAB 和 ASAF = IFAA 的 RC 
(2) 模型 

20 

13.66 

-133.31 


2.82 

0. 847 

(b) 关联分析 

对比 


V 

df 


比率 

第一维度 

(1)—(2) 

92. 28 

10 


75. 97% 

第二维度 

(2)—(5) 

22. 38 

8 


18. 42% 

第三或更高维度 

(5) 


6.81 

10 


5.61% 

总计 

(1) 

121. 47 

28 



(c) 压缩表格 

df 

L 2 

BIC 


A 

P 

1. (3) 中的独立模型 

9 

105. 10 

38. 59 


8. 87 

0. 000 

2. (3) 中的 RC(1) 模型 

4 

12. 87 

-16. 52 


2. 66 

0. 012 

3. (6) 中的独立模型 

9 

108. 13 

41. 99 


9. 50 

0. 000 

4. (6) 中的 RC(2) 模型 

1 

0. 33 

-7. 02 


0. 22 

0. 566 


注: 详情见下文。 


在我们对行和/或者列类别加入相似的平等性约束之前，我们可能会想比 
较不同模型的似然比检验统计值。表 5. 2( b ) 为关联分析提供了分割统计值 
( ANOAS )。 第一维度分析了总关联的大约76%，第二维度分析了此外的 
18. 4%，余下的 5. 6%留给了第三或更高的维度来分析。分割的结果清晰地指 
出，更复杂的公式 RC (2) 应该比其更简单的公式 RC (1) 更具优势。注意， RC (2) 
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模型中两个跨元交互的约束 ( S : =1 _ 2 = S ' =1 ^^ = o ) 是为了达到集中 
和尺度约束的范围，从而唯一地确定所有行数值和列数值的参数。 

通过检验收敛的估计值，第六个模型在两个维度中都加入了以下平等性约 
束： ECO = MTO= MIL = ENR = SAB ； ASAF = IFAA 。 注意，这些约束与 

列在第三行中的约束是不一样的。在获得10个自由度的情况下，模型拟合程度 
的下降是细微且不显著的 （ L 2 为 6. 8, p 为 0. 7 4)。换句话说，受限 RC (2) 模型是 
一个最终的首选模型，即便它没有最大的负 BIC 统计值。因为在两个维度中都 
加人了平等性约束，所以最初的8 X 5表在 RC (2) 中可以简化为一个新的 4 X 4 
聚集表。当这张表与另外一个来自受限 RC (1) 模型的 4 X 4 聚集表比较时，它 
有不同的单元格频率。 

表格 5. 2( c ) 检验了在统计模型中采用错误的聚集表所产生的后果。基于 
从约束的 RC (1) 模型中得到的新的聚集表，自变量模型有9个自由度， L 2 是 
105。它显示岀现有模型和表 5. 2( a ) 中的模型1之间的卡方检验差异是非常小 
并且可以接受的 (19 个自由度， L 2 为 16. 4) 。然而，表 5. 2( c ) 第二行的 RC (1) 模 
型耗掉了 4 个自由度却只得到13个 L 2 , 在 0.05 信任水平上将被拒。另一方 
面，从约束的 RC (2) 模型中得到的聚集表中的结果非常不同。当两个独立模型 
拟合度的恶化未达到统计显著性时，表 5. 2( c ) 第四行的 RC (2) 模型提供了令人 
满意的结果。 

如古德曼 (1981c) 所言，有约束的 RC(2) 模型的一个主要优点是，它既满足 
了单一性，同时也满足了结构性的标准，从而决定了某些类别是否应该合并。 
这种基于模型的研究为经验研究者如何在保全关联的内在结构的同时 最小化 
总体关联的损失提供了重要的指引。事实上，先前的研究已经指出，不合适或 
不准确的类别集合会导致变量之间对关联扭曲的或错误的理解 （ H ou & 
Myles ， 2008 ； Wong , 2003b )。 一旦 不正确的集合将曲解带人并且影响 到接下 

来的分析，除非有好的原因能解释为什么某些类别可以合并，否则应该采用最 
佳策略，通过关联模型或者其他统计模型来理解。 

表 5. 3展示的是受限 RC ⑴和 RC (2) 模型的参数估计值。由于 R 中 
模块的当前限制，渐进标准误只有从 RC (1) 模型中获得。对于 RC (2) 模型，取 
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而代之的是自举标准误。此外，图 5. 1和图 5. 2还提供了受限 RC (2) 模型中行 
和列估计数值的图像(表 5. 2的第五行）。这些图表将帮助我们决定哪些行和/ 
或者列类别最有可能有相等的分数，从而可以合并 (Clogg & Shihadeh ， 1994： 
92)，关键是确定行类别组或列类别组。从图 5. 1中可以明显看出，主要忧虑的 
以下类别在第一维度中 （ MTO 、 MIL 、 SAB 、 ENR 、 ECO 和 OTH ) 有着相似的 
行估计值。另一方面，第二维度中其他忧虑 ( OTH ) 的估计数值与其他5个类别 


相距甚远，因此不应该与它们合并在一起。 

表 5. 3主要忧虑例子中经由选择的参数估计值 




参数估计值 



(1) 在 MIL = ECO 

= MTO , (2) 在两个维度均有 ECO = 

描 述 

ENR = SAB = 

OTH 和 MTO = 

= MIL = ENR = 

ASAF = IFAA 条件下的 SAB 和 ASAF = IFAA 的 


RC (1) 模型 

RC (2) 模型 


第一维度 

第一维度 

第二维度 

今 m 

1.357 

1. 360 

0. 703 


(0. 510) 

(0. 181) 

(0.173) 

/Jtim POL 

—0. 427 

_ 0. 549 

一 0. 319 


(0. 094) 

(0. 145) 

(0. 257) 

MIL 

-0. 173 

—0. 037 

0. 255 


(0. 047) 

(0. 055) 

(0. 035) 

ECO 

—0. 173 

—0. 037 

0. 255 


(0. 047) 

(0. 055) 

(0. 035) 

ENR 

0. 032 

-0. 037 

0. 255 


(0. 046) 

(0. 055) 

(0. 035) 

SAB 

0. 032 

—0. 037 

0. 255 


(0. 046) 

(0. 055) 

(0. 035) 

MTO 

-0. 173 

-0. 037 

0. 255 


(0. 047) 

(0. 055) 

(0. 035) 

PER 

0. 851 

0. 827 

— 0. 236 


(0. 040) 

(0. 117) 

(0. 254) 

OTH 

0. 032 

— 0. 093 

-0. 720 


(0. 046) 

(0. 148) 

(0. 145) 
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(续表) 




参数估计值 


(1) 在 MIL = ECO 

= MTO , (2) 

在两个维度均有 ECO = 

描 述 

ENR = SAB = 

OTH 和 

MTO = MIL = ENR = 

ASAF = IFAA 条件下的 

SAB 和 ASAF = IFAA 的 


RC(1) 模型 


RC(2) 模型 


第一维度 

第一维度 

第二维度 

v jm EUAM 

— 0. 699 

— 0. 622 

0. 642 


(0. 088) 

(0. 147) 

(0. 163) 

IFEA 

— 0. 295 

—0. 400 

-0. 676 


(0. 138) 

(0. 169) 

(0. 173) 

ASAF 

0. 457 

0. 473 

0. 159 


(0. 068) 

(0. 099) 

(0. 137) 

IFAA 

0. 457 

0.473 

0. 159 


(0. 068) 

(0. 099) 

(0. 137) 

IFI 

0. 080 

0. 075 

-0. 284 


(0. 223) 

(0. 237) 

(0. 294) 


注: 括号中的数值为列 （ 1 ) 中的渐进标准误和列 ( 2 ) 中的自举标准误。 


0.6 


0.4 


0.2 


m 

勢 0 


I 


_ 0 . 2 


-0.4 


一 0. 6 


MTO 


參 

MIL 


•ECO 


♦POL 


# SAB 

ENR 


•PER 


1_L 


J_L 


J - 1_I_L 


—1 — 0.8 — 0.6 — 0.4 — 0.2 0 0.2 0.4 0.6 0.8 1 


第一绅 

图 5.1 主要忧虑 I 


计数值 


OTH 
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0.6 


0.4 


0 . 


1 


•EUAM 



•ASAF 




• IFI #IFAA 





, 丨 丨 PIFEA_ 

1 1 1 1 1 m 


_ 0 . 2 


-0.4 


— 0 . 6 


1 -0.8 -0.6 —0.4 —0.2 0 0.2 0.4 0.6 0. 

第一维度 


图 5. 2生存环境的估计数值 


同样，生存环境的列估计值指出，无论是 in 和 IFAA 或者 ASAF 和 IFAA ， 
都形成了它们自己的集合。要想明白为什么后者而不是前者形成了正确的集 
合，我们必须回顾每一个值的大小对不同轴上的变量的影响。如果 ? m {t 
很大，那么 x 轴上的值会随之 增大; 如果值很小，那么 y 轴上将几乎没有变 
量分布 (Clogg & Shihadeh , 1994:99 )。 尽管在 IFIA 和 IFAA 之间的行估计值 
在第二维度上是相似的，但是它们在第一维度上的差别很大。另一方面，当 
IFIA 和 ASAF 之间的行估计值在第二维度上不相似时，相对较小的值意味 
着，当加人平等性约束时，整体的影响将相应变小。 

例义2:使用关联模型作为量度工具 

尽管很多社会科学的应用自然会包括不同类别的变量，但是研究者常常会 
把它们转化为连续型测量，这样，它们就可以被更加轻易地应用于其他复杂的 
多变量模型中。这会带来实践上的两难，因为我们不知道是什么构成了这些变 
量的最优数值分布。在这个部分，我们利用从偏对数乘积模型中得到的行、列 


in* 









I 湃表数擔分析 


和层的估计数值的“外在的”或“依外在情况而变的”排序特性来获取“理想的” 
数值。需要强调的是，对标准变量(从这里可获得外在排序）的选择是至关重要 
的，因为采用不同的标准变量将导致不同的排序情况。这些被选择的变量应当 
是建立在扎实的理论和先前的实践基础上的。下面的例子还通过运用以上的 

变量来拓展现有的文献，从而产生更加令人信服的尺度 （Clogg & Shihadeh , 
1994； Smith & Gamier , 1987) 0 

使用两个或两个以上的标准变量来获得另一个变量的尺度，并不是一个全 
新的想法 ( Duncan ， 1982、1984)。在职业所反映的社会经济地位的案例中， 
Nam - Powers 社会经济地位分数来自在职者的收入和从详细的职业头衔中得出 
的教育资历独立排序的简单平均值 (Nam & Powers ， 1983)。这种算法的主要 
问题是，测量值的获得不是建立在模型的基础上，因此并不足以最大化其中涉 
及的关系。邓肯所做的一个杰出的研究 (1961) 是建立了一个在模型基础上的方 
法，使用在职者的收人来预测职业声望并进一步解释作为社会经济地位分数的 
预测值。尽管这种方法很流行，但是争议依然存在，这些生成的分数是否可以 
被解释为地位、声望或者都不是 ( Nakao , 1992)? 另一方面，克洛格等人 （1994) 
暗示过，在关联模型的框架里产生以模型为基础的量是可能的。然而，通过使 
用每一个标准变量(教育和收人)来划分个体的职业，然后对两个分数取平均值 
的方法是次优的。他们还暗示，同时获得理想的分数是可能的，虽然是使用存 
在细微差别的模型。在这里，我们并不打算进一步讨论这个话题。在接下来的 
例子中，我们将解释这个任务在先前提到的偏关联框架中是如何轻易实现的。 

通过使用从综合公用事业宏观数据系列中得到的 1980 年普查数据的 1% 
样本 (Ruggles et al . ， 2004 )， 第二个例子对 20 岁到64岁之间的男性和女性这 
两个职业群体的教育和收入情况制作交互表格(见表 5. 4 )。 职业是行变量，有 
12个主要群体： （1) 专业 人士； （2) 管理 人士； （ 3 )销 售者； （4) 神职 人员； （5) 工匠； 
(6) 技工； （ 7) 交通协管员； （ 8) 工人； （ 9) 农厂主； （ 10) 农场 工人； （ 11) 服务 工人； 
(12) 家庭工人。教育是列变量，有 4 个类别：（1)高中 以下； （2) 高中； （3) 大学； 
(4) 大学以上。最后，职业收入作为层变量，有 4 个类别：（1) 少于 1000 美元; （ 2) 
1000 美元至 5999 美元； (3)6000 美元至 9999 美元； （ 4) 10000 美元或以上。为 
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了方便操作，以下的分析并没有把男性和女性分开，而是分析总体的劳动力从 
而得出一个关于总体劳动力的单独的社会经济地位聚合指数 ( TSEI )。 因此，以 
下的分析是建立在一个三向表 (12X4X4) 上的，它包括 819798 个个体。需要 
强调的是，如有必要，这样的分析可以很容易地拓展为包括更多详细的职业名 
称的四向或者多向分类表。 


表 5. 4教育与收入关系下的职业情况(样本来自1980年普查数据的1%) 




高中以下 



高中 


20岁至64 
岁的男性 
和女性 

少于 

1000 

美元 

1000 

美元至 

5999 

美元 

6000 

美元至 

9999 

美元 

多于 

10000 

美元 

少于 

1000 

美元 

1000 

美元至 

5999 

美元 

6000 

美元至 

9999 

美元 

多于 

10000 

美元 

专业人士 

1096 

1847 

1255 

925 

3321 

6123 

6830 

5524 

管理人士 

1541 

3134 

3145 

3300 

1915 

4429 

7035 

9421 

销售者 

4183 

5139 

1857 

1272 

8080 

8586 

4788 

4294 

神职人员 

6033 

9211 

5046 

1058 

28130 

44589 

20074 

3408 

工匠 

4354 

13430 

18670 

9821 

2250 

9075 

18286 

14358 

技工 

14587 

31470 

16390 

3751 

8242 

17532 

12825 

3956 

交通协管员 

1517 

5820 

6197 

2372 

721 

2909 

4141 

2070 

工人 

3581 

9268 

5463 

1007 

1341 

3808 

3163 

815 

农厂主 

1454 

3109 

1055 

888 

563 

1909 

1018 

1051 

农场工人 

3237 

3851 

377 

102 

731 

858 

247 

84 

服务工人 

14882 

22182 

5363 

1136 

11650 

15818 

5524 

2122 

家庭工人 

6033 

3475 

63 

18 

1603 

1005 

30 

16 



大学 



大学以上 


20岁至64 
岁的男性 
和女性 

少于 

1000 

美元 

1000 

美元至 

5999 

美元 

6000 

美元至 

9999 

美元 

多于 

10000 

美元 

少于 

1000 

美元 

1000 

美元至 

5999 

美元 

6000 

美元至 

9999 

美元 

多于 

10000 

美元 

专业人士 

5968 

8783 

7701 

6483 

8733 

14329 

19386 

28143 

管理人士 

1011 

2162 

3536 

6649 

697 

1299 

2362 

10796 

销售者 

3214 

3621 

2485 

3177 

793 

1134 

1292 

3597 

神职人员 

11532 

16837 

6975 

1839 

2563 

2995 

2060 

1600 

工匠 

1009 

2719 

3521 

3409 

296 

503 

626 

1273 

技工 

1586 

3025 

1726 

668 

245 

415 

238 

218 
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湃表 《 据分析 


(续表) 


20岁至64 
岁的男性 
和女性 


大学 



大学以上 


少于 

1000 

美元 

1000 

美元至 

5999 

美元 

6000 

美元至 

9999 

美元 

多于 

10000 

美元 

少于 

1000 

美元 

1000 

美元至 

5999 

美元 

6000 

美元至 

9999 

美元 

多于 

10000 

美元 

交通协管员 

387 

941 

564 

316 

86 

138 

79 

48 

工人 

994 

1988 

542 

145 

158 

259 

101 

56 

农厂主 

171 

409 

223 

245 

65 

172 

99 

174 

农场工人 

293 

290 

67 

31 

32 

63 

18 

30 

服务工人 

4288 

4916 

1452 

766 

616 

794 

347 

300 

家庭工人 

370 

186 

3 

4 

67 

37 

5 

2 


表 5. 5总结了一系列应用于三向表的统计模型。第一个是得出了极差结果 
的完全独立模型 (174 个自由度， L 2 等于586906)，这表明3个变量之间有某种 
依存的关系。第二个模型在教育和收入之间假定了条件独立性（当职业受到控 
制时)。如果该模型的拟合是令人满意的，它将符合在多数分层文献中提到的 
简单马尔科夫因果链，即教育 — 职业 — 收入。尽管模型 (第二行) 有了一个显著 
的改善，但考虑到完全独立性上存在略大于95%的偏离，模型的相对拟合度仍 
然不能令人满意。另一方面，这个模型在教育、职业和收入(第三行)之间具有 
所有的二元交互项，考虑到获得了关联程度额外的 3. 6% (99 个自由度， L 2 等于 
6540) ，因此这个模型提供了一个更好地拟合其中关系的近似值。 

剩下的模型(第四行至第八行)尝试把不同的偏关联参数分解到对数乘积 
要素中。例如，模型4分解了职业一教育和职业一收入的偏关联，模型5则进一 
步加入了约束，使职业的估计值在两个偏关联中是一样的。根据传统的标准， 
两个模型的拟合优度并不令人满意。模型6将全部偏关联项分解成对数乘积要 
素，模型 7 只加人了等量行（职业的)数值，模型8加入了等量行、列和层数值。 
在传统的标准下，没有一个模型的拟合优度是令人满意的，但是与其他模型相 
比，模型7是比较令人满意的。尽管它可能会增加3个偏关联参数的维数，但是 
它不会在这里进行，因为我们的目的是提取职业、教育和收人之间最大化的线 
性关系。 
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模型5、模型7、模型8中的行(职业的）估计值在表 5. 6( a ) 中，它们分别是 
TSEI 1、 TSEI 2 和 TSEI 3。 由于估计数值被标准化了，所以通过为它们的平均 
值和标准差分配特定值，它们可以被轻易地转化为类似 SEI 的测量值。与我们 
对职业排名的常识相符的是，专业人士和管理者显然排在最高的社会经济地位 
上，农场工人和家庭工人则排在最底层。 

表 5. 5通过教育和收入缩放职业的关联模型 U 970 年） 


模型描述 df L 2 BIC 


1. 完全独立 

174 

586906. 22 

584536. 90 

3. 85 

0. 000 

2. 条件独立 

108 

27957. 40 

26846. 78 

6.00 

0. 000 

3. 完全二元交互 

99 

6540. 40 

5192. 33 

2. 64 

0. 000 

4. RC(1) + RL(1) 偏关联 

148 

70860. 99 

68845. 70 

11. 17 

0. 000 

5. 带有单一性行(职业)数值 
的 RC(1)+RL(1) 偏关联 

158 

185518. 25 

183363. 80 

18. 27 

0. 000 

6. RC(1)+RL(1)+CL(1) 
偏关联 

143 

42101. 44 

40154. 24 

8. 27 

0. 000 

7. 带有单一性行(职业)数值 

的 RC(1) +RL(1) +CL 
⑴偏关联 

8. 带有单一性行、列和层数 

153 

174073. 13 

171989. 76 

17.80 

0. 000 

值的 RC(1) + RL(1) + 
CL ⑴偏关联 

157 

177264. 57 

175126. 73 

17.76 

0. 000 


注:总 体样本规模是819798。 

表 5. 6缩放职业中关联模型的选择参数估计 

% 


职业估计值 



RC(1) 
+ RL(l) a 


RC(1) + 
RLCD+CLCl) 1 


RC(1) + 
RL(1)+CL(1)< 
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(续表) 


描 述 


职业估计值 



RC(1) 

+ RL(l) a 

RC(1) + 
RL(l)+CL(l) b 

RC(1) + 

RL(1) + CL(1) C 

(a) 职业数值 






TSEI1 

TSEI2 


TSEI3 

销售者 

0.217 

0. 223 


0.231 

神职人员 

0. 144 

0. 171 


0. 175 

工匠 

0. 086 

0. 055 


0. 046 

技术工人 

-0. 158 

_ 0. 164 


-0. 176 

交通协管员 

—0. 050 

—0. 079 


-0. 097 

工人 

-0. 141 

-0. 145 


-0. 160 

农厂主 

-0. 024 

-0. 043 


-0. 045 

农场工人 

-0. 399 

_ 0 . 390 


一 0. 388 

服务工人 

-0. 105 

—0. 092 


-0. 090 

家庭工人 

一 0 . 506 

-0. 484 


-0. 457 

(b) TSEI 分数、职业声望和社会经济地位之间的相关性 




SEI PRESTIGE TSEI1 

TSEI2 

TSEI3 

SEI 

1 . 000 




PRESTIGE 

0 . 880 1 . 000 



TSEI1 

0. 925 0. 913 1 . 000 



TSEI2 

0. 938 0. 910 0. 998 

1 . 000 


TSEI3 

0. 946 0. 9 U 

5 0.995 

0. 999 

1 . 000 


注:刀 切法标准误在这里没有显示，因为它们都非常小 （CO. 001) 。此外， R = 职业， C =教育， L = 
收人。 

a. RC ⑴ +RL(1) 与行约束一致(职业）。 

b. RCX1)+RU1)+CU1) 与行约束一致(职业）。 

a RC(1)+RL(1)+CL(1) 与行、列及层变量上的约束一致。 

表 5. 6( b ) 同时通过加权的邓肯 SEI 和 NORC 的职业声望对3个测量值进 

行了交互相关分析。在 0. 9 95或者更高的交互相关水平下，这3个 TSEI 测量 

值几乎没有区别。当然，这并不代表它们没有细微的差别。尽管12个主要职业 

群体的排序非常稳定，但是交通协管员和服务工人的相对位置在不同的排名下 
会有些许变化。 

有意思的是，我们可以看到 SEI 与声望之间的关联程度很低 (0 . 88) ，这个 
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发现与职业的社会经济分布的“易错”估计相一 a (Featherman Hauser , 
1976:405)。在这个发现下，也许这3个衍生的 TSEI 测量值与邓肯的 SEI 的相 
关程度高于与职业声望的相关程度并不令人惊讶。它们与邓肯的 SEI 具有相 
当高的相关程度(大于 0. 92) 暗示了，这3个衍生的 TSEI 测量值分享了作为社 
会经济地位测量值表面上和结构上的效度。事实上，当一切保持相等时，相对 
于 SEI ， 我们首选当前的测量值，因为 SEI 作为源于声望的职业地位测量，存在 
解释上的模糊性。另一方面， TSEI 分数是纯粹建立在社会经济基础上的职业 
地位的测量值。这个方法与最初的支持者和使用者的意图完全一致(要了解稍 
微不同的建构方法，请参阅 Ganzeboom , de Graaf & Treiman , 1992； Ganze - 

boom & Treiman , 1996)。 这个技术已经被成功地运用在创造香港本土的 SEI 
分数上 (Wong & Wu ， 2006)。此外，研究者发现，这个构建的测量值比另外两 
个国际测量值——国际标准职业声望分数 （ SIOPS ) 和国际社会经济指标 
( ISEI ) ——有更好的效果。 



第 6 章 I 结论 


本书的目标是向读者提供一个关于不同关联模型的系统的、连贯的且具教 
导性的介绍。在过去的20多年里，这些模型由众多学者发展而来，其中，古德曼 
是最著名的开创性研究者，后来的古洛格和邓肯都有贡献。本书详细讲解了双 
向表中的对数线性、对数乘积、混合和多维度关联模型以及它们之间的关系，并 
在随后的章节中扩展至对三向及多向交互表的分析。当三元交互项并不有趣 
和必要时，我们引入了一系列统计模型用以分解部分或所有的二元交互参数。 
然而，二元和三元(或者高阶)交互项可以在条件关联模型中被分解。通过大量 
的实例，读者可以更好地认识这些关联模型的解释力和灵活性。 

应该强调的是，在理解交互表形式下一组类型变量之间的关系时，用以分 
析二元或高阶交互表的 RC ( M ) 及其相关的关联模型仅提供了一种特别的统计 
模型。其他更精巧的统计模型同样可以提供具有竞争性且有时更好的理解，这 
在实证研究中不应该被忽略。建模的策略无非是通过建构具有竞争性的、可选 
择的模型，以便我们获得关于变量之间复杂关系的富有洞见的理解。然而，读 
者可能会冒险选择了一个不正确模型，进而系统地扭曲了基本的关系模式。另 
一方面，如果拟合优度统计值是令人满意的，我们就可以发现，关联模型家族是 
具有解释力和多种用途的模型，它们可以帮助我们提高解释力度。事实上，越 
复杂的关系，特别是在三向表和多向表中，具有偏同质性或者异质性约束的多 
维 RC ( M ) — L 关联模型越可能提供更简单和具有解释力的结果。唯一的问题 

是，我们需要谨慎对待添加所有、部分或者不添加跨元交互约束，并且恰当地计 
算特定模型自由度的行为。 

两种实践应用的例子进一步证明， RC 类型的关联模型在一般的社会科学 




研究中具有广泛的应用前景。事实上，类似 RC 类型的关联模型已经被开发岀 
来，用于潜在结构分析 （ Anderson ， 2002; Anderson & Vermunt , 2000； Ver - 
munt , 2001) 和试题反应模型 （Anderson & Yu ，2007)。 并且，众所周知的是， 
RC 类型的关联模型与对应分析和传统相关分析是密切相关的 （ Goodman ， 
1984、1986)。最近，德罗伊 ( deRooij ，2008) 等学者论证道，在正方形表格中，当 
行与列类别一一对应时， RC ( M ) 关联模型可以重新参数化为二模型间距离关联 
模型，而这两个模型会生成相同的检验统计值和期望频率。 

在社会科学应用中，经常岀现通过加入动态质量和动态位置假设来处理非 
对称关联的情况，这时，广义的重力模型牛顿法则可以重新参数化为 RC ( M ) 关 
联模型 ( deRooij ， 2008)。在使用内积法则时，古德曼的 RC ( M ) 关联模型中的 
参数 im 和 jm 可以被理解为组内间距。在广义重力模型的例子中，相应的距离 
参数 zilm 和 zi 2 m 可以被理解为组间距离。只有后者才可以提供关于距离测量 
的恰当解释，并且，两组动态质量和动态位置参数均可以在一张图表中呈现出 
来，这样有助于视觉理解 (de Rooij & Heiser , 2005)。 

在特定的环境下，我们发现，广义重力模型与本书介绍的偏关联和条件关 
联模型是相关的。自然科学和社会科学公式之间的紧密关系肯定是一个有趣 
的发展。尽管存在与自然科学的相似性，将质量和距离形式的解释作为一种隐 
喻毕竟是超乎社会现实的。将关联参数原来的差异视为关联的趋势和水平，这 
在解释上可能更为宽泛。尽管如此，我们希望读者现在开始信任并且欣赏关联 
模型，因为它可以提供一种富有解释力且灵活的方法，用以理解一组类型变量 
之间的复杂关系。 
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注释 

[ 1 ] 在确定+的符号时存在任意性，因为乘积 (iMiVj) 才是唯一被确定的。为了降低模糊性和便于自 
举标准误的计算，内在关联系数 （</>) 被定义为正值，但估计的行数值 (A) 与列数值 （ Vj ) 也会相应 
改变。 

[ 2 ] 例如，除了 RC 要素之夕卜，有学者 ( Kateri，Ahmad 8^ Papaioannou , 1998) 通过使用正交多项式表 
述一系列多维的 U 、 R 、 C 和 R + C 参数。 

[3] 德罗伊等人 (de Rooij Heiser, 2005) 提醒我们注意对那些对称正态化数值，如在纯数学上的 
“距离”的(不当)解释，因为它们表示的是数量积之间的距离，而不是数值之间的距离。 

[ 4 ] CDAS 可通过个人向斯科特 • 伊莱亚森 （Scott Eliason ) 索取。可以从网站 www . uvt . nl / fac - 
ulteiten / fsw / organisatie / departementen / mto / software 2. html 上下载 。 R 是一款免费的统计软 
件，可以从 www . r - project . org / 上下载。但 CDAS 只能在模仿 DOS 环境下运作,^^则可在 DOS 
和 Windows 环境下运作，而 R 是唯——个可同时在 UNIX 、 Windows 和 MacOS 环境中进行操作 
的统计软件。同样，读者可能对 Latent Gold 感兴趣 (Vermunt & Magidson , 2005) , 这是一款流 

行的商业统计软件，用以估计潜在类别和其他有限混合模型，它将对数乘积关联模型当做潜在变 
量模型。 

[ 5 ] 读者可以在网站 https ： // webspace . utexas . edu / dpowers / www / 中参考计算例子。同样，由哈伯 
曼 （1995) 编写的 DASSOC 程序可以直接从 STATLIB 的网站上 （ http :// lib . stat . emu . edu / gen - 
eral /) 下载。 

[ 6 ] 如同 4 m ， 当前的模块并没具备添加跨元交互约束的功能，并且我们不可能获得对数增量参 
数的渐进标准误。因此，对于要求跨元交互约束的模型而言，我们转而采用自举或者刀切法标 
准误。 

[7] 如果我们可以将模型 H 、 M 2 、 M 3 写成 H [ M 2 [ M 3 , 那么，这3个模型便是嵌套的。然而，如 

果它们之间只是部分重叠，并且它们不能彼此包含，那么，这3个模型便是非嵌套的。非嵌套模 

型在检验统计值上的差异并不具备适当的卡方诠释，反而会涉及非嵌套卡方检验 （ Weakliem , 
1992)。 

[8] 亨利 （1981) 报告了一个不同的计算刀切法标准误的公式。他对方差的计算包括一个小的修正因 
子 ( N - D / N , 这里的 N 表示样本量。对于大多数的实践而言，当 N 很大时，这一差异应该会 
很小。 

[9] 例如，适用于一些对数线性模型(如 U、R、C 和 R + C) 的刀切法标准误要比它们从 GLIM 和 R 
计算得到的渐进标准误稍大。 

[10] 如果这个模型是真实的，那么 L 2 /df 比率应该非常接近1。然而，对于一些实证从业者而言，小于 
2的比率也是可以接受的。 

[11] 如果我们转而采用 2 T f = 0 正态化方法，那么，列效应参数便分别等于 一 0. 337、 一 0.058、 
0. 147 和 0. 249, 而且它们相应的渐进标准误分别为 0. 044、 0. 024、 0. 026 和 0. 048。 

[12] 我们可以考虑两种过度拟合数据的设定情况。然而，正如笔者 (2001) 所举的例子， RC(2) 模型可 
以很好地拟合白人和黑人的男性和女性。更重要的是，当同一模型作为条件 RC(2) 模型同时应 
用到 4 个组别中时，可能会生成有着进一步约束的更简单的模型，这样会产生髙度可解释的结 
果。第4章会更深人地讨论这一方法。 

[1 3 ] RC(2) 模型的渐进标准误可以从 DASSOC 程序中直接获得 （Haberman， 1995)。这是因为, R 中 
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当前的模块没有添加适当的跨元交互约束，因此不能直接使用。我们同样可以计算自举标 
准误(使用超过50000个重复样本），而且会发现它们与渐进标准误具有高度可比性，尽管它们的 
值常常很大。这也同样适用于刀切法标准误。 

[14] 如果行与列按照以下方式排序，即对于所有 i 和 j ， 都有优比0,^1,那么，这一分布就被定义为 
“等向性”(深入的讨论请见 Yule , 1906及 Goodman , 1981 b )。 

[15] 方程 4. 20中的层间差异的比率同样适用于对数线性和对数增量层效应模型。例如， LU 和0^ 
的层间比率分别为 [( Pk _ Pk，)]/[(Pk — Pk ，）] 和[(扣一令 k *)]/ [(令 k _ 令 k . )]。 

[16] 关于应用于多表格的一致性关联模型，请见豪特等人的著作 ( Hout ， 1984； Ishii - Kuntz , 1991)。 

[17] 在同一组参数下的平等性约束并不难理解，如 fZ 3 = / I4 和 v 2 = v 5 。 后一约束表述为“平等”而不是 
“同质”。 

[18] 作者感谢杰罗恩 • 沃蒙特 (Jeroen Vermunt ) 在个人交流中与自己分享的关于这些类型模型跨元 
交互约束所存在的潜在误区及解决方法。 

[19] CP 分解方法的实践应用有时会被称为 “ CP 解决方法的简并序列的出现”而变得复杂。当这些情 
况出现时， CP 运算法则的收敛会变得相当慢(如在 《em 中超过 200000 次迭代），并且在 CP 运算过 
程中， CP 解决方法的一些要素会越发相关 ( Stegeman ， 2007)。 CP 的简并序列解决方法的岀现 
是由于 CP 的目标函数没有最小值，而且无限大，因此， CP 解决方法的序列无法收敛并且呈现简 
化的模式 ( Kmskal，Harshman & Lundy , 1989)。通过对要素矩阵添加正交性约束，可以避免 
CP 解决方法的简并序列 （ Harshman & Limdy ， 1984)。当然,这将导致模型拟合值的损失，而且 
模型自由度需要进行相应的调整 ( Stegeman ， 2007: 603) 。 

[20] 另一方面，这些混合模型对于一些社会科学学者而言是具有吸弓 | 力的，因为它们不需要考虑跨元 
交互约束和特定模型关于自由度的正确计算。 

[21] 根据山口 （ Yamaguchi , 1998:241) 的研究，模型12中的条件对数优比可以表示为古德曼和豪特 
的类回归层效应模型。 

[22] 这两个高度参数化模型的渐进、刀切法和自举标准误十分接近，并且均达到了三位数的显著 
程度。 
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